Home page | Каталоги и базы данных

Научные и технические библиотеки
Воройский Ф.С.
ГПНТБ России

Организация и технология переработки карточных
каталогов в машиночитаемую форму для создания
электронных каталогов

Актуальность данной темы заключается в том, что объем каталогизированных современными средствами текущих поступлений в подавляющее число библиотек России и стран СНГ не превышает 10—15% от объема накопленных ими документальных фондов. В результате практически все библиотеки вынуждены продолжать пополнять традиционные карточные каталоги, преимущественно используя, хотя и привычные, но не достаточно эффективные методы библиотечного обслуживания. В настоящее время многие библиотеки, к сожалению, преимущественно в одиночку, приступили к переработке своих карточных каталогов в машиночитаемую форму для создания исходной основы будущих полноценных электронных каталогов.

Накоплен определенный опыт (как положительный, так и отрицательный) выполнения этих работ, частично отраженный в ряде публикаций. Поскольку переработка карточных каталогов в машиночитаемую форму находится пока еще в начальной стадии, свою задачу мы видим в обобщении этого опыта, что, как мы надеемся, поможет заинтересованным библиотекам и библиотечным системам оптимизировать указанную работу исходя из их возможностей и конкретных местных условий.

1. Организация работ

Центральным вопросом, который требует решения на первом (подготовительном) этапе выполнения работы, является определение порядка или последовательности переработки каталогов. Принципиально возможны и опробованы в различных библиотеках четыре основных варианта решения указанной задачи:

1.1. Неизбирательная ("сплошная") переработка библиографических записей (БЗ) по генеральному каталогу;

1.2. Переработка, основанная на выделении приоритетных тематических разделов и/или видовых признаков литературы;

1.3. Последовательная обработка ретроспективы, учитывающая время выпуска и/или поступления литературы в библиотеку;

1.4. Обработка ретроспективы в соответствии с обращением читателей к конкретной литературе, имеющейся в фондах библиотеки.

Практическая реализация каждого из перечисленных подходов имеет как достоинства, так и недостатки, поэтому кратко остановимся на их характеристике.

1.1. Основным достоинством неизбирательного подхода к переработке в машиночитаемую форму БЗ, хранящихся в генеральном каталоге, является относительная простота его подготовки и реализации. При использовании технических способов считывания БЗ (см. раздел 2) этот метод может обеспечить наиболее быстрое получение "черновой версии" электронного каталога. Однако последнее не означает, что использование этого способа при дальнейшей доработке БЗ с целью приведения их в вид, соответствующий требованиям полноценного ЭК, приведет к быстрому успеху.

Основными недостатками указанного способа переработки являются его высокая стоимость и трудоемкость, а при "ручной" набивке записей и наиболее долгий путь к созданию ЭК, пригодного для эксплуатации в подразделениях обслуживания читателей (пользователей). Необходимо также указать еще на два обстоятельства, связанные с данным способом переработки каталогов:

наряду с ценной литературой на совершенно равных основаниях переработке подлежат все БЗ, включая и те, которые относятся к малоспрашиваемой или совсем не спрашиваемой литературе, а также к утраченной или списанной, но еще "присутствующей" в каталогах (интересно — многие ли библиотечные работники могут похвастаться чистотой своих каталогов?!);

по отношению к возможности использования ЭК данный способ его создания характеризуется условием: "все или ничего". Это означает, что введение в эксплуатацию разделов ЭК, отражающих генеральный каталог библиотеки, скажем, от буквы "А" до "Д" или даже "Ю" бессмысленно, поскольку потребует параллельного использования всей совокупности традиционных каталогов. Помимо того, что это неудобно как для читателей, так и персонала библиотеки, нарушается один из основополагающих принципов внедрения автоматизированных информационных систем, в соответствии с которым старая и новая технология (особенно на начальных этапах работы последней) не должны сосуществовать в одних и тех звеньях системы. Объясняется это в частности тем, что сотрудники, привычные к старой технологии, длительное время предпочитают использовать ее средства, независимо от их недостатков. Последнее ведет к существенному удлинению времени их адаптации к новым условиям работы и отрицательно сказывается на качественных показателях работы автоматизированной системы в целом.

Исходя из сказанного, можно рекомендовать указанный метод переработки традиционных ("карточных") каталогов только для тех библиотек, которые располагают значительными финансовыми, материальными и трудовыми ресурсами, или книжные фонды которых относительно невелики.

1.2. Переработка, основанная на выделении приоритетных тематических и/или видовых разделов литературы, позволяет последовательно и достаточно оперативно создавать, а также вводить в эксплуатацию каталоги отдельных подразделений или частные разделы общих ЭК библиотек по соответствующим им массивам литературы, в том числе и обеспечивать к ним удаленный доступ. Сложность реализации указанного способа переработки каталогов определяется особенностями организационной структуры каждой конкретной библиотеки и качеством систематизации и предметизации литературы, прошедшей библиографическую и аналитическую обработку.

Избирательный способ переработки каталогов для библиотек, располагающих крупными фондами и не имеющих достаточных ресурсов для быстрого перевода каталогов в электронную форму, в существенной мере снимает недостатки предыдущего способа.

Однако необходимо отметить, что в случае отсутствия выделенных подразделений библиотеки и их фондов организация указанных работ усложняется, так как для перезаписи библиографических карточек требуется использование определенных разделов предметных каталогов и последующая соответствующая чистка всех каталогов библиотеки. Следует учитывать также, что из-за некачественно проводимой в библиотеке предметизации и систематизации могут возникнуть проблемы, связанные с невысоким уровнем показателя полноты поиска по ЭК. Последний, впрочем, будет не ниже, чем при поиске по существовавшему ранее карточному каталогу. Другим недостатком использования данного метода является необходимость параллельного использования при обслуживании читателей электронного и карточного каталогов.

Указанные недостатки могут быть сняты в случае организации координированной совместной работы по созданию ЭК в функционально связанных группах библиотек, имеющих близкие по тематическому составу фонды литературы. Предполагается при этом, что каждая из библиотек — участниц работы обрабатывает ретроспективную часть своего карточного каталога по закрепленной за ней тематике. Готовые массивы машиночитаемых БЗ в дальнейшем могут быть использованы разными библиотеками для формирования собственных ЭК, а при необходимости — и сводного каталога данной группы или системы библиотек (см. ниже п. 2.1.3.).

Выгоды подобной корпоративной переработки каталогов очевидны: существенно сокращается время создания ЭК библиотек, участвующих в этой работе, исключается дублирование, экономятся финансовые, материальные и трудовые ресурсы.

1.3. Последовательная переработка ретроспективы по годам поступления литературы в библиотеку (т. е. назад от времени начала систематической автоматизированной обработки поступлений литературы на год, два, три и т. д.) так же, как и переработка массивов БЗ по тематическому и видовому признаку литературы, позволяет последовательно вводить в эксплуатацию во всех режимах разделы электронных каталогов библиотек. Наиболее часто используется в крупных (и в первую очередь — научно-технических) библиотеках, в том числе — и в ГПНТБ России. Основным недостатком данного метода является необходимость длительного сохранения и параллельного использования электронного и карточного каталогов.

Определенную сложность при реализации этого метода составляет также отбор БЗ для перевода их в машиночитаемую форму. Указанная операция может производиться путем выполнения промежуточных операций, включая использование выборки данных о поступлении литературы из книг инвентарного и безынвентарного учета, из машиночитаемых массивов БЗ Российской книжной палаты или Сводного каталога научно-технической литературы, а также путем сочетания указанных способов. Последний принцип используется, в частности, в ГПНТБ России.

1.4. Обработка ретроспективы в соответствии с обращением читателей к литературе, имеющейся в фондах библиотеки, является теоретически возможным способом решения задачи, хотя прецеденты его использования в практике библиотек нам не известны. Тем не менее можно полагать, что он имеет право на реализацию, поскольку потенциально позволяет в течение одного-двух лет выделить блок наиболее спрашиваемой литературы и создать соответствующий фрагмент ЭК. Основной недостаток способа — необходимость одновременного использования электронного и традиционного каталогов. Однако со временем в традиционном каталоге останется редко спрашиваемая или совсем не спрашиваемая литература. Таким образом обеспечиваются условия организации архивных фондов или выделения литературы, подлежащей рассмотрению на списание. Данный способ можно использовать в сочетании с 1.2 или 1.3.

На подготовительном этапе также необходимо:

  • решить вопросы, связанные с финансированием и техническим обеспечением работ;
  • создать рабочие группы исполнителей и (при необходимости) заключить договоры с организациями, участвующими в выполнении работ;
  • назначить лиц, ответственных за контроль качества записей и их редактирование;
  • подготовить рабочие места для исполнителей;
  • составить график и расписание выполнения работ;
  • разработать поэтапную технологию выполнения работ и рабочие инструкции;
  • подготовить дополнительные программно-аппаратные средства обеспечения работ (например, конверторов, словарей, рубрикаторов, средств поддержки транслитерации и т. д.), если их использование планируется;
  • разработать правила приемки результатов работ и ввода готовых массивов в эксплуатацию.

Характер решения указанных подготовительных организационных и технологических задач зависит от особенностей конкретных библиотек, состояния их каталогов, а также выбранной технологии исходной переработки БЗ и создания на их основе полноценного электронного каталога.

2. Организация и технология переработки традиционного каталога в электронный

Собственно технология переработки традиционных (карточных) каталогов в ЭК при выполнении ее в полном объеме включает два основных этапа:

  • первичную обработку каталогов, связанную с перезаписью библиографических карточек в машиночитаемую форму;
  • доработку полученных машиночитаемых массивов библиографических данных до качества, необходимого для формирования ЭК.

Следует отметить, что в небольших библиотеках или подразделениях библиотек, располагающих фондами ограниченных размеров, оба этапа могут быть совмещены. В средних и больших библиотеках по основным фондам литературы эти этапы могут выполняться одновременно, но по разным тематическим или видовым массивам литературы. Тем не менее, поскольку по характеру выполняемых технологических процессов они существенно различаются, рассмотрим их особенности раздельно.

2.1. Первичная обработка каталога (ввод данных в ЭВМ)

Целью данного этапа можно считать создание исходной основы или черновой версии ЭК. Будучи переведенными в машиночитаемый вид, записи традиционного карточного каталога могут содержать только ограниченный состав элементов описания документов, которые не позволяют реализовать в полном объеме поисковые (или так называемые индикативные) и информационные функции ЭК. В первую очередь сказанное относится к отсутствию в этих записях полноценного поискового образа документов, обеспечивающего полноценный тематический поиск литературы и поиск по персоналиям, а также аннотаций. Указанные записи не могут рассматриваться как полные и с точки зрения требований действующих коммуникативных форматов, что может иметь значение при решении ряда профессиональных задач, связанных с межбиблиотечным обменом данными. Тем не менее и в такой "усеченной" форме машиночитаемые массивы БЗ, если они достаточно полно отражают библиотечные фонды, имеют существенные преимущества по отношению к традиционным каталогам и поэтому могут служить для замены последних в качестве того, что мы назвали "черновой версией ЭК".

Известны и опробованы в разных библиотеках следующие основные варианты технологий перевода карточных каталогов в машиночитаемую форму, а также их сочетания:

  • ручной (так называемый бесперфорационный) набор и ввод данных;
  • сканирование каталожных карточек;
  • заимствование готовых машиночитаемых массивов БЗ или электронных каталогов других организаций.

2.1.1. Ручной набор данных является на сегодня наиболее часто употребляемым методом первичной обработки каталогов. Его достоинства: относительная простота организации и технологии выполнения, невысокая (особенно в России!) стоимость, слабая зависимость от работы других библиотек и организаций, возможность поэтапного контроля качества.

Недостатки данной технологии: относительно невысокая производительность труда и связанные с нею значительные сроки преобразования каталогов крупных библиотек и фондов; необходимость выделения специального оборудования и помещения для создания достаточного количества рабочих мест.

Производительность труда при вводе библиографических данных в ЭВМ зависит от организации работ, квалификации исполнителей и оплаты. Если исключить начальный период обучения клавиатурным работам и правилам заполнения полей библиографического описания, то можно считать, что 50 БО в день — вполне приемлемая норма. Однако в известных авторам случаях реального использования данной технологии она ни разу не была достигнута. Как правило, она составляла 20—40 обработанных карточек. Объяснение лежит прежде всего в способах стимулирования и отсутствии у исполнителей систематической практики.

Что касается оборудования рабочих мест, то оно предполагает наличие нескольких рабочих станций, работающих в сетевом или автономном режиме, но предпочтительно расположенных в одном помещении. При этом может быть организована многосменная работа. Продолжительность каждой смены и длительность рабочего дня операторов определяются частными условиями библиотек и привлекаемых к выполнению работ исполнителей.

Организация работ по данной технологии должна предусматривать посменный контроль выполненных заданий, помощь операторам в заполнении полей наиболее сложных БО, а при необходимости — и редактирование отдельных записей перед их загрузкой в итоговую базу данных. Перед загрузкой наработанных массивов данных необходим контроль на наличие дублетных записей, появление которых весьма вероятно при любой технологии ввода. Функции текущего контроля и помощи операторам должны возлагаться на руководителей рабочих групп (или смен) операторов, контроль массивов записей перед загрузкой их в итоговую БД возлагается на сотрудников отделов автоматизации, которые выполняют функции администрирования базами данных библиотеки.

2.1.2. Сканирование каталожных карточек является наиболее быстрым способом черновой переработки ретроспективы карточных каталогов; но требует использования специализированных программно-аппаратных комплексов, обеспечивающих считывание исходных текстов, анализа их содержания, структурирования данных и их переноса в соответствующие поля библиографического формата. Создание и поддержка подобных комплексов стоят весьма дорого и под силу только специализированным организациям, которые предоставляют заинтересованным библиотекам услуги по переводу карточных каталогов в машиночитаемую форму. В России такой фирмой является московская ProSoft-M (Professional Computer Systems & Components). Используемая фирмой ProSoftM технология включает три этапа: предобработку и сканирование карточек, индексацию (разметку полей) каталога, формирование массива записей в MARC-ориентированном формате.

Основным достоинством данной технологии является возможность быстрой переработки весьма крупных электронных каталогов. Так, по оценкам фирмы ProSoft-M, переработка каталога русской книги и периодических изданий ГПНТБ России, содержащего 900 тыс. наименований документов, должна занять год. Перевод генерального каталога ЦБС "Кунцево" Западного административного округа Москвы, содержащего 67 тыс. карточек, выполнен фирмой в 1997 г. в течение примерно пяти месяцев.

Недостатки данной технологии: высокая стоимость работ, не очень высокое качество их результатов (ниже качества ручного ввода), необходимость в короткий срок выплаты весьма значительных финансовых средств.

Качество переработки БЗ с использованием технологии сканирования карточек существенно ниже, нежели при ручном (клавиатурном) вводе и переработке массивов машиночитаемых данных с ЭК других организаций.

Основные недостатки:

  • несоответствие состава данных, вводимых в поля БО документов, их назначению (например, путаются записи полей "Коллективный автор" и "Область ответственности", "Основное заглавие" и "Продолжение заглавия", "№ серии" и "№ тома" и т. д.);
  • попадание в одно поле сведений, относящихся к разным полям (например №№ и названия серии или тома вместе с основным заглавием);
  • наличие внесенных грамматических ошибок;
  • не прочтенные при сканировании элементы БО (преимущественно в трудночитаемых каталожных карточках).

С учетом изложенного результаты данного вида переработки требуют существенно больших трудозатрат при их последующей доработке в полноценный ЭК, нежели те же результаты, полученные другими методами. Тем не менее, по отзывам сотрудников тех библиотек, где выполнено сканирование каталогов, изготовленная данным способом черновая версия ЭК вполне годится для замены карточного каталога в подразделениях обслуживания читателей.

2.1.3. Заимствование готовых машиночитаемых массивов БЗ или ЭК других организаций

Заимствование готовых записей из ранее подготовленных другими организациями или службами машиночитаемых массивов библиографических данных, по нашему мнению, является наиболее перспективным способом как ретроспективной переработки карточных каталогов, так и обработки текущих поступлений для актуализации электронных каталогов библиотек. При обработке текущих поступлений литературы эта технология является основной для библиотек развитых западных стран. В частности, в США более 80% библиотек используют для этой цели службу ON-LINE CATALOGING (ранее эту функцию выполняла PRISM) корпорации OCLC. Другими крупными корпорациями, выполняющими аналогичные услуги, являются RLIN, WLN, PICA и др. Эти же организации выполняют заказы заинтересованных библиотек, связанные с переводом в машиночитаемую форму их каталогов. В нашей стране указанные функции будет выполнять проектируемый в настоящее время Российский центр корпоративной каталогизации.

В настоящее время источниками машиночитаемых массивов БЗ являются или могут стать выпускаемая Российской книжной палатой на машиночитаемых носителях, в том числе на CD—ROM, "Национальная библиография России", Сводный каталог научно-технической литературы ГПНТБ России (ведется с 1976 г.), а также массивы БЗ, созданные в результате координированной обработки ретроспективы другими библиотеками.

При выборе источников заимствования записей анализу и оценке подлежат:

  • стоимость приобретения исходных записей;
  • степень соответствия тематического и видового состава исходных массивов фондам заимствующей библиотеки;
  • полнота БО документов и формата записей исходных массивов соответствующим характеристикам создаваемого каталога;
  • производительность и стоимость необходимой доработки заимствованных записей в записи создаваемого или пополняемого ЭК.

Стоимостные показатели заимствования записей из разных источников могут различаться весьма существенно.

Степень соответствия тематического и видового состава исходных массивов фондам библиотеки, производящей заимствование, также как и полнота БО документов и формата записей исходных массивов в существенной мере определяют как степень сложности технологии переработки этих массивов, так и производительность и стоимость необходимой доработки заимствованных записей в записи создаваемого или пополняемого ЭК. Анализ указанных показателей имеет весьма важное значение для выбора не только источников заимствования записей, но и способа переработки карточного каталога. В самых оптимальных случаях, когда массивы записей источника заимствования и создаваемого ЭК имеют высокий коэффициент пересечения (весьма условно — не менее 30—40% общих наименований литературы), а также единый формат описания, эффективность реализации данного способа переработки по критериям "оперативность" и "стоимость" является максимальной.

В менее благоприятных случаях, которые могут характеризоваться невысоким коэффициентом пересечения (совпадения) заимствуемого и создаваемого массивов БЗ, разными их форматами и/или составами заполненных полей и т. п., технология переработки каталогов может быть достаточно сложной. В частности, она может потребовать помимо предварительного использования специальных операций поиска и отбора записей из заимствуемого массива, дополнительно операций конвертирования форматов, перевода на русский с языка оригинала или транслитерации содержания отдельных полей данных, ручного доввода отсутствующих записей и т. д. В качестве примера может служить технология, используемая в ГПНТБ России для преобразования ретроспективы карточного каталога отдела иностранного комплектования.

2.2. Доработка машиночитаемых массивов библиографических данных для формирования ЭК

Характер необходимой окончательной доработки машиночитаемых массивов БЗ определяется:

  • составом и содержанием требований, предъявляемых к ЭК в конкретных библиотеках или их подразделениях в соответствии с составом решаемых с их помощью задач;
  • состоянием исходных карточных каталогов или массивов, из которых производится заимствование машиночитаемых записей;
  • степенью отработки массивов БЗ, полученных в результате их предварительной переработки.

При всем многообразии возможных вариантов перечисленных условий применительно к каждой конкретной библиотеке или группе библиотек очевидно, что выполнение данного вида работ невозможно без обращения к первичным документам, находящимся в фондах библиотеки. Особенно это относится к составлению аннотаций, индексированию документов и составлению перечней персоналий, упомянутых в различных источниках. Очевидно также, что указанный вид работ носит весьма трудоемкий характер и требует высокой профессиональной подготовки ее исполнителей. В технологическом плане данный вид работ не имеет существенных отличий от работ, связанных с аналитической обработкой документальных источников и корректурой или редактированием полей БО. Учитывая трудоемкость указанных процессов и низкую их производительность, библиотекам, имеющим достаточно большие фонды литературы (100 тыс. и более наименований), можно рекомендовать подобную доработку производить только избирательно по наиболее приоритетным видам источников с учетом ретроспективы либо в кооперации с другими близкими по характеру комплектования библиотеками.

В заключение отметим, что авторы будут весьма благодарны коллегам, которые сочтут возможным поделиться с ними своим опытом переработки карточных каталогов, дополнить или уточнить приведенные данные.


Copyright © 1995-99 ГПНТБ России