Научные и технические библиотеки №4 2005 год
Содержание:

11-я Международная конференция «Крым-2004»

Секция «Информационно-лингвистическое обеспечение библиотечно-информационных систем»

Зайцева Е.М. Что нужно современной библиотеке: гипертекстовое лингвистическое пространство или автоматизированные лингвистические системы

Сукиасян Э.Р. Общая концепция и программа развития Библиотечно-библиографической классификации на 2002–2010 гг

Гендина Н.И., Меркулова А.Ш. Подготовка библиотечных кадров в сфере лингвистического обеспечения библиотечной технологии: проблемы совместимости и преемственности содержания среднего, высшего и дополнительного образования


Секция «Информационное и библиотечное обеспечение процессов образования, исследования и управления»

Любаров В.М. Прогноз трендов развития общества для разработки стратегий в области познания, образования, накопления знаний и библиотечного дела

Грузнова Е.Б. Электронные ресурсы национальной библиотеки как составная часть информационно-образовательного пространства


Секция «Библиотека, муниципальная и краеведческая информация»

Морылева Н.И. Научная библиотека университета в системе создания и распространения краеведческой информации (на примере Научной библиотеки Новгородского университета)

Балашова Н.М. Ресурсный центр по проблемам местного самоуправления и муниципальной информации на базе публичной библиотеки (на материале ЦБС «Киевская», Москва)


Секция «Медицинские и больничные библиотеки»

Дрешер Ю.Н. Проблемы потребностей, мотиваций и ценностных ориентаций личности в библиотерапии


ПРОБЛЕМЫ ИНФОРМАЦИОННОГО ОБЩЕСТВА

Евстигнеева Г.А., Земсков А.И. Информационная поддержка науки


ПРОЕКТИРОВАНИЕ БИБЛИОТЕК

Советы библиотекарям, приступающим к проектированию библиотечных изданий. Обзор зарубежного опыта


ДИСКУССИОННЫЙ КЛУБ

Добровольский В.В. Грустные результаты беспредметной дискуссии

Столяров Ю.Н. Разъяснения даны. Вопросы остались


Поздравление 60 лет Владимиру Павловичу Нечипоренко


УДК 027.008.04(063)

11-я Международная конференция
«Библиотечные и информационные ресурсы
в современном мире науки, культуры, образования и бизнеса» – «Крым–2004»

(5–13 июня 2004, Автономная Республика Крым, Украина)

 

Зайцева Е.М.
ГПНТБ России

Что нужно современной библиотеке:
гипертекстовое лингвистическое пространство
или автоматизированные лингвистические системы

Вряд ли на территории бывшего Советского Союза найдется такая библиотека, которая считала бы, что обладает всеми необходимыми для своего успешного функционирования лингвистическими средствами. Даже если предположить, что такая библиотека нашлась и ее набор лингвистических средств, возможно, достаточен, то их наполнение все равно требовало бы постоянного совершенствования. Это в лучшем случае. Реально же положение дел таково, что чаще всего библиотеке не хватает лингвистических составляющих или же их использование не автоматизировано.

Можно сколько угодно рассуждать о достоинствах и преимуществах Библиотечно-библиографической классификации (ББК) или Универсальной десятичной классификации (УДК), но пока мы не будем иметь полного выпуска средних таблиц ББК или полных таблиц УДК, нельзя говорить о хорошем состоянии лингвистического обеспечения (ЛО) библиотек. А ведь желательно располагать не только печатными, но и электронными версиями названных классификаций. Сегодня же у нас имеются только два печатных выпуска средних таблиц ББК: Социальные науки в целом. Обществознание. История. Исторические науки (2001 г.); Таблицы типовых делений общего применения (2003 г.).

В лучшем положении, безусловно, находится УДК, поскольку ВИНИТИ за последние годы опубликовал пять томов полных таблиц УДК: 1 – Вспомогательные таблицы. 0 – Общий отдел (2001 г.); 2 – 1/3 Философия. Религия. Общественные науки (2002 г.); 3 – 5/54 Математика. Естественные науки (2002 г.); 4 – 55/59 Геологические и биологические науки (2003 г.); 5 – 6/621 Прикладные науки. Технология. Инженерное дело (2003 г.).

ГПНТБ России выпускает электронные версии ББК и УДК на CD–ROM: ББК для массовых библиотек, полную и сокращенную версии УДК. Однако понятно, что электронные версии следуют печатным изданиям, поэтому актуальными в них являются только классы, соответствующие вышедшим томам.

Современную библиотеку в области лингвистического обеспечения должен характеризовать:

  • предварительный набор лингвистических средств;

  • высокий интеллектуальный уровень этих средств;

  • регулярная актуализация этих средств;

  • автоматизированное ведение и использование лингвистических компонент.

Распространяются ли высказанные соображения на все виды библиотек, в частности на электронные библиотеки? По моему мнению – да. В случае электронных библиотек требования должны быть даже более высокими.

«Электронная библиотека – это локальные или распределенные электронные ресурсы, объединенные единой идеологией структуризации и доступа» [1]. Под библиотекой понимается (если рассматривать библиотеку не с точки зрения ее статуса как учреждения) «информационная система, предоставляющая в распоряжение общества сконцентрированные в ней информационные ресурсы» [2]. Таким образом, общим у этих двух понятий является не только слово библиотека, но и наличие информационных ресурсов с той разницей, что обычные библиотеки могут включать электронные ресурсы, а электронные библиотеки состоят исключительно из них и поэтому требуют особых технологий организации и поиска информации и доступа к ней.

Думается, что постепенно грань между этими двумя понятиями станет более размытой в силу увеличения объема электронных ресурсов в библиотеках. Поэтому представляется нецелесообразным категорически разделять ЛО традиционных и электронных библиотек. Наоборот, нужно находить пути их сближения, поскольку помимо традиционных автоматизированных библиотечно-информационных систем (АБИС) существуют АБИС, включающие электронные библиотеки. Экономичнее для организации и удобнее для пользователей иметь единую структуру ЛО в АБИС последнего типа.

Среди исследований по электронным библиотекам имеются попытки трактовки ее лингвистического, программного обеспечения и информационных ресурсов как гипертекстового лингвистического пространства [3], которое как информационная система, очевидно, должно составлять основу электронной библиотеки. Оправдана ли такая постановка вопроса? Да, такое пространство существует и, может быть, интересно как факт, но это понятие не равносильно понятию ЛО электронной библиотеки.

Развивая традиционное представление о лингвистическом обеспечении, можно определить состав ЛО современной АБИС как совокупность применяемых в технологии АБИС информационных языков, лингвистических процессоров и словарей.

В составе ЛО электронной библиотеки должны присутствовать те же основные элементы, но набор их может отличаться. Так, среди информационных языков традиционной АБИС выделяют язык библиографического описания. В электронной же библиотеке для описания электронных ресурсов может использоваться другой язык метаданных с ограниченным набором элементов. Безусловно, напрашивается проведение параллели: необходимо принятие национального стандарта на язык метаданных для описания электронных ресурсов по аналогии со стандартом на язык библиографического описания.

Использование классификационных и вербальных языков желательно как в традиционной АБИС, так и в электронной библиотеке, что предусматривает наличие соответствующих словарей – баз данных классификаций, предметных рубрик, тезаурусов.

В последнее время в традиционных АБИС стали применяться авторитетные файлы. Их следовало бы задействовать и в электронных библиотеках. В области словарей наиболее отстающим и одновременно наиболее перспективным направлением представляется разработка тезаурусов для традиционных АБИС и электронных библиотек.

Поиск по свободному тексту, конечно, привлекает: он легко доступен и быстр, позволяет оперировать новой терминологией. Однако это не может компенсировать его недостатков: значительный шум, низкую точность и высокую степень информационных потерь. Даже использование программ морфологического анализа и программ, учитывающих частоту встречаемости ключевых слов (что имеет место в поисковых системах Интернета), не сильно спасает положение.

Необходима смысловая обработка информации, проводимая полностью автоматически или с привлечением результатов интеллектуального труда человека. При этом последнее скорее всего более эффективно, поскольку никакие машины и программы не могут полностью заменить человека там, где требуется интеллект и профессиональные знания. Вот почему при поиске столь привлекательно использование тезауруса, в котором термины структурированы человеком с установлением иерархических, синонимических и ассоциативных связей.

Проблема заключается в том, что тезаурус требует постоянного обновления за счет включения новых терминов и смещения акцентов при выборе дескриптора. В традиционных АБИС помимо тезауруса, незаменимого при узкотематическом поиске, по-прежнему актуально применение традиционных классификаций. Имеющиеся электронные версии УДК, ББК и ГРНТИ, представленные в едином интерфейсе, позволяют не только использовать их по отдельности при поиске (как это реализовано, например, в системе автоматизации библиотек ИРБИС), но и разработать на их основе систему тематического поиска с единым входом по ключевому термину.

Для электронных библиотек кажется целесообразным ввести классификационные индексы в структуру метаданных, различив элементы Subject (Предмет) – ключевые термины или предметные рубрики и Class (Класс) – классификационный индекс.

Перспективной представляется также разработка систем, использующих классификацию текстов на основе их автоматического смыслового анализа [4], возможно и в сочетании с классификационной схемой [5, 6]. Что касается лингвистических процессоров, то наблюдается тенденция интенсивного развития этой компоненты ЛО, особенно это касается электронных библиотек, которые в принципе не могут существовать без сильной лингвопроцессорной части, обеспечивающей автоматическую обработку текста (автоматический смысловой анализ, автоматическое индексирование).

Важно отметить, что в современных традиционных АБИС и электронных библиотеках происходит тесное сплетение элементов ЛО, которое реализуется в образовании автоматизированных лингвистических систем. Под автоматизированной лингвистической системой предполагается понимать автоматизированную систему, представляющую собой набор лингвистических средств и программ, которые встроены или функционируют в качестве отдельного модуля в АБИС или электронной библиотеке.

Анализ существующих в библиотеках технологий показывает, что можно выделить несколько видов таких систем с точки зрения их функциональных возможностей.


1. Лингвистические системы, обеспечивающие индексирование документов и представляющие собой автоматизированное рабочее место систематизатора/предметизатора или систему автоматического индексирования.

Примером может служить универсальное АРМ систематизатора на базе УДК, ББК или ГРНТИ, разработанное ГПНТБ России. Система обеспечивает навигацию в классификационной схеме по графу на полную глубину по вертикали, а также по горизонтали на основе ссылочного аппарата и поиск по индексам (кодам) и по ключевым словам. Интерфейс снабжен удобными средствами отбора табличных индексов и построения полных индексов, отражающих содержание документов, с последующим их переносом в библиографическое описание, созданное при помощи любой АБИС. Автоматизированные системы индексирования и классификации текстов на основе их смыслового анализа также попадают в этот разряд.


Рис. 1. Универсальное автоматизированное рабочее место систематизатора на базе УДК системы ИРБИС.

 

2. Лингвистические системы, предназначенные для обеспечения читательского поиска.

В качестве примера можно привести системы поиска в электронном каталоге с использованием базы данных тезауруса, предметных рубрик или классификационной системы.



Рис. 2. Поиск по терминам тезауруса в Электронном каталоге ГПНТБ России.

 


Рис. 3. Поиск по индексам УДК в Электронном каталоге ГПНТБ России

 

3. Лингвистические системы, поддерживающие процесс каталогизации или описания ресурса.

Примером может служить система использования авторитетных файлов при каталогизации.



Рис. 4. Каталогизация с использованием авторитетного файла «Коллективные авторы» в системе автоматизации библиотек ИРБИС.

 

4. Лингвистические системы, контролирующие и дополняющие содержание документов.

Такими системами являются системы проверки орфографии, транслитерации, перевода, реферирования и т.п.


5. Системы ведения словарных баз данных, например автоматизированные места персонала службы ведения указанных баз данных.

Разработка и совершенствование разного рода автоматизированных лингвистических систем с комфортным для пользователя интерфейсом представляется наиболее перспективным направлением развития лингвистического обеспечения как автоматизированных библиотечно-информационных систем, так и электронных библиотек.


Список источников

  1. Земсков А.И. Электронные библиотеки: Учебн. пособие / Земсков А.И., Шрайберг Я.Л. – М.: Изд-во ГПНТБ России, 2001.

  2. Карташов Н.С. Общее библиотековедение: Учебник для вузов в 2-х ч. / Карташов Н.С., Скворцов В.В. – М.: Изд-во Моск. гос. ун-та культуры, 1996.

  3. Яшина Н.Г. Гипертекстовое лингвистическое пространство электронной библиотеки: Автореф. дис. … канд. пед. наук: 05.25.03. – Казань, 2004.

  4. Сбойчаков К.О. Перспективы развития ИРБИС в плане применения системы смыслового анализа текстов для создания полнотекстовых хранилищ знаний современной библиотеки // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: Тр. конф. – М., 2003. – Т. 1. – С. 122–125.

  5. Сбойчаков К.О. Распределение ключевых слов по рубрикам ГРНТИ в базе данных Электронного каталога ГПНТБ России // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества [Электронный ресурс]: Тр. конф. – Электрон. дан. – М., 2004. – 1 электрон. опт. диск (CDROM).

  6. 6.    Классификатор SDK 2.0 [Электронный ресурс]. – Электрон. дан. – М.: МедиаЛингва, 1995–2003. – режим доступа: http://www.medialingua.ru.

  
На главную