Home page | Каталоги и базы данных

Научные и технические библиотеки


 

УДК 025:65.011.56

Щербинина Г.С.

Координатное индексирование
в свете интеграционных процессов

В связи с объединением информационных и телекоммуникационных систем России в единое информационное пространство на основе международных стандартов и требований обеспечения информационной безопасности все большее развитие получает информационная функция библиотек. Новые электронные средства передачи информации меняют их облик, библиотечные процессы и библиотечную систему в целом. Все это продиктовано предстоящей интеграцией в мировое информационное пространство.

Процесс создания баз данных электронных каталогов не обходится без проблем, характерных, как показывает практика, для подавляющего большинства российских библиотек. Например, не устранено дублирование в обработке информации как на уровне одной библиотеки, когда в разных отделах создаются записи на один и тот же документ, так и на межбиблиотечном уровне. А методику заимствования созданных разными библиотеками записей библиотекари только начинают осваивать. Существуют также проблемы машиночитаемой каталогизации, в том числе низкий уровень унификации методов аналитической обработки документов, лингвистического обеспечения, качества и др.

Потенциал традиционной библиотечной технологии практически исчерпал себя. В современных условиях важно взаимодействие библиотек при создании библиографических баз данных, и сфера машиночитаемой каталогизации заключает в себе большие резервы для подобного сотрудничества. К машиночитаемой каталогизации относятся процессы, связанные с созданием библиографических записей разного вида документов, гармонизацией правил описания на международном уровне, развитием форматов MARC, раскрытием содержания документов, поиском информации; а также вопросы лингвистического обеспечения и т.д. Идут мощные интеграционные процессы по многим из перечисленных направлений.

Мне хочется остановиться на некоторых проблемах лингвистического обеспечения, в состав которого со временем стали включать методики индексирования документов и запросов, правила и алгоритмы создания, ведения и пополнения баз данных электронных каталогов.

Качество информационных библиотечных продуктов зависит не только от стандартов составления библиографического описания, машиночитаемых форматов, но существенным образом и от уровня содержательной обработки документов. И если первое почти не зависит от рядовых библиотекарей, то второе зависит от них в огромной степени.

Существует такое важное свойство информационно-поискового языка, как семантическая сила. Одно из наиболее емких определений этого понятия дал Ч. Мидоу: "Выразительностью, или семантической силой, называется способность языка идентифицировать предмет, различать тонкие признаки предмета и описывать предмет на различных уровнях детализации". Замечательные слова! Они напрямую характеризуют качество электронных каталогов.

Я не буду говорить о всех элементах лингвистического обеспечения, в частности, о таких информационно-поисковых языках, как классификационные системы УДК и ББК, которые при желании могут отразить "тонкие признаки предмета", а вспомню о другом ИПЯ – языке ключевых слов, который не менее, а может быть, и более важен для пользователя в силу доступности и привлекательности, выраженной в применении средств естественного языка.

Время для библиотекарей все больше сжимается, за короткий срок они должны освоить огромные пласты того информационного знания, полный объем которого не представляют даже теоретики. Библиотека должна соответствовать принципиально новому уровню в своем развитии. Это поняли еще не все библиотекари. И поглощенные текущей работой многие из них не замечают, что вопросам лингвистического обеспечения необходимо уже сейчас уделять самое серьезное внимание. Нужно заметить при этом: чем больше проходит времени, тем масштабнее будущее редактирование, без которого не обойтись, если иметь в виду предстоящую интеграцию в мировое информационное пространство.

Ежедневно индексируя, редактируя и вводя в электронные каталоги различные документы, библиотекари всякий раз вновь и вновь обдумывают стратегию отбора и написания ключевых слов. С дальнейшим развитием информационных процессов в каталогизации взгляды на индексирование уточняются и выверяются. В настоящее время, когда завершился этап становления электронных каталогов, необходимо органично использовать в библиотеках опыт индексирования научно-технической документации в информационных небиблиотечных системах.

Как показывает практика, при координатном индексировании существуют два подхода. Первый используется разработчиками информационных систем с информационным образованием, второй – библиотекарями с классическим библиотечным образованием. Взаимопроникновение информационного и библиотечного опыта очень важно и способно обогатить и индексатора, и информационного работника.

При первом подходе ключевые слова односложны и могут состоять из одних прилагательных (как правило в единственном числе) или только корня слова. Нормализованный словарь при таком подходе составить более чем проблематично.

Второй подход более понятен библиотекарям, он сближается с методикой составления предметных рубрик, предметизацией. В этом случае библиотекари отстаивают (или почти отстояли) множественное число, устойчивые (и не очень) словосочетания. При втором подходе словарь составить можно, хотя и с большим трудом. Развивать эту тему на множестве примеров можно достаточно глубоко, но в задачи данной публикации это не входит.

Есть, как всегда, и третий путь – вообще не принимать во внимание непонятное нерегламентированное координатное индексирование. Но этот вариант не хочется даже обсуждать, как априори неверный.

Думается, что рациональное зерно найдется при любых подходах, если ставить перед собой созидательные задачи. Это и будет интеграция в действии. Скорее всего, при неограниченных возможностях поиска по всем полям с использованием булевой алгебры, стандарта "Поиск и выдача", который иногда называют "Протоколом функционально объединенных систем" (или протоколом Z39.50), и прочих способов, используемых интернетовскими машинами поиска, проблема отбора и написания ключевых слов не будет иметь такой остроты, как ныне. Нужно ли учитывать при этом, что многие библиотеки работают до сих пор в локальном режиме с сохранением линейных условий поиска?

Тема координатного индексирования на сегодня не разработана. Только обратная связь с читателем, анализ наблюдений за работой пользователей в электронных каталогах, опыт создания баз данных позволяют библиотекам говорить о методике координатного индексирования.

Создавая свои электронные каталоги, многие библиотеки имеют собственные концепции отбора и написания ключевых слов. Но насколько они отвечают общим тенденциям? Ведь очень многие библиотекари, наработав некоторый опыт, считают свои убеждения непогрешимыми. Хотя никто пока не провел исследования предпочтений пользователя при составлении тематического поискового предписания в библиографических базах данных, т.е. практические наработки еще не имеют теоретического обоснования.

Созданные же базы данных и отдельные записи начинают самостоятельную жизнь, с ними работают многие пользователи, их заимствуют другие библиотеки. Заимствованная запись – это запись, в которой не только качественное библиографическое описание, но и детально проработанные предметные рубрики и ключевые слова. Кстати, заимствование записи – это тоже показатель качества работы библиотеки – создателя записи.

Необходимо не только "делиться" созданными словарями, авторитетными файлами ключевых слов (замечу, что их создание – колоссальная работа), но и публично обсуждать разные методики координатного индексирования, искать, в конечном счете, золотую середину. Думаю, что отдельным библиотекам, а тем более координаторам корпоративных проектов просто необходимо выступать по этому поводу, представлять собственные методики на суд библиотечного сообщества. Пусть свое слово скажут и информационные работники.

В создавшейся ситуации единственно правильным будет коллегиальное решение проблемы. Иначе напрашивается неутешительный вывод о том, что наши национальные библиотечные базы данных еще долго не войдут полноправной составляющей в мировые информационные ресурсы.

В настоящее время библиотечное дело и информатика сближаются как никогда. При этом новые информационные технологии являются не целью, а средством для современного, качественно нового обслуживания. Новые информационные технологии существенно меняют структуру библиотек, традиционный "путь книги", сознание тех, кто обслуживает потребителей информации. Пока еще скромно, но все-таки повышается социальный статус библиотек. Библиотечные фонды и информационные продукты включаются в состав государственных информационных ресурсов и характеризуют общий уровень социально-экономического развития страны.

Можно сказать, что успешные эксперименты по машиночитаемой каталогизации открыли новую эру в технологии библиотечно-библиографического дела – эру интеграции, суть которой заключается в однократной обработке первичных документов, обмене результатами обработки, многократном и многоцелевом использовании полученной информации. Другими словами, преимущества хранения сведений о документах в машиночитаемой форме заключаются, во-первых, в возможности многоаспектного поиска, во-вторых, в возможности их тиражирования.

Машиночитаемая каталогизация в современных условиях имеет огромное значение не только для библиотек, но и для других служб, работающих с потоками информации и документации. Огромные перспективы открывает сочетание преимуществ сетевых технологий с возможностями библиотек, когда даже самая удаленная из них сможет обеспечить объем, глубину, разнообразие и качество информации.


Copyright © 1995-2002 ГПНТБ России