Научные и технические библиотеки №9 2004 год
Содержание:

Карташов Н.С. Механизм разработки региональных библиотечных программ

Дрешер Ю.Н., Атланова Т.А. Корпоративное управление и корпоративная культура в библиотечно-информационной сфере

Захаров А.Г., Алексеев Н.Г. Научная библиотека РАН – элемент метасистемы «Наука»

Сукиасян Э.Р. Сравнительный анализ моделей различных ИПЯ. Статья 1

Мельникова А.А. Комплектование в условиях рынка: взаимодействие библиотек вузов и книготорговых фирм

Осетрова О.В. «Организация информационного обеспечения исследователей в научных библиотеках» – факультативный курс

Гусак О.А., Езова С.А. Самоменеджмент руководителя библиотеки

Нгуен Тхи Донг. Национальная библиотека Вьетнама и проблема подготовки библиотечных работников


24-я КОНФЕРЕНЦИЯ МЕЖДУНАРОДНОЙ АССОЦИАЦИИ БИБЛИОТЕК ТЕХНИЧЕСКИХ УНИВЕРСИТЕТОВ

Виттен И. Программное обеспечение процесса формирования электронной библиотеки

Криль Х. Маркетинг партнерства: новый подход к обеспечению устойчивого развития электронной библиотеки


ЮБИЛЕИ

Пашина Н.А. Научной библиотеке Курского государственного технического университета – 40 лет

Варганова Г.В. Библиотечной серии издательства «Профессия» – 5 лет


ОБЗОРЫ. РЕЦЕНЗИИ

Соколинский Е.К. Новый международный проект

Коломейчук Е.М. Опыт информационно-библиотечной системы Российской академии наук и проблемы управления деятельностью библиотек


ИНФОРМАЦИОННЫЕ СООБЩЕНИЯ

Мелентьева Ю.П. Международная книговедческая конференция «Книга и мировая цивилизация»


НАШИ
АВТОРЫ


УДК 025.4.06

Сукиасян Э.Р.

Сравнительный анализ моделей различных ИПЯ.
Статья 1

Подход к проблеме. Обоснование методики

В теории информационно-поисковых языков (ИПЯ) определяются  три вида ИПЯ: классификационные, предметизационные и языки координатного индексирования. Два последних иногда объединяются в группу вербальных ИПЯ, в которых лингвистические единицы (ЛЕ) выражаются словами или словосочетаниями. Соответственно терминами индексирования являются: в классификационных ИПЯ – классификационные индексы, в предметизационных – предметные рубрики (ПР), в языках координатного индексирования – ключевые слова (КС) или дескрипторы.

Стандарты, регламентирующие процессы индексирования, устанавливают в качестве обязательного условия наличие соответствующих инструментов. В первом случае эту функцию выполняют таблицы классификации, во втором – списки ПР; если же речь идет об индексировании дескрипторами, то нужен тезаурус. Все эти пособия, как правило, находятся в состоянии постоянного развития, поддерживаются в процессе индексирования. Каждое из них имеет соответствующий вспомогательный аппарат. Например, таблицы классификации обязательно располагают алфавитно-предметным указателем (АПУ).

Каждый систематизатор должен знать требование ГОСТ 7.59–2003: на основе АПУ, имеющегося в таблицах, формируется АПУ к каталогу, отражающий реальное содержание фонда. Для того чтобы этот аппарат был контролируемым, систематизатор ведет служебную систематическую контрольную картотеку (СКК), в которой под каждым классификационным индексом фиксируются ПР АПУ. Вспомогательным аппаратом предметизационного ИПЯ является картотека типовых заголовков и подзаголовков ПР.

Тезаурус (в отличие от дескрипторного словаря) содержит ряд указателей, облегчающих работу с основной его частью – лексико-семантическим собранием терминов. В числе этих указателей имеются систематический указатель дескрипторов, указатель иерархических отношений дескрипторов, пермутационный указатель терминов; а в некоторых тезаурусах еще и указатели, представляющие систему парадигматических связей между дескрипторами в наглядной, графической форме.

Надо иметь в виду, что весь указанный аппарат может иметь как традиционную карточную форму, так и современную машиночитаемую. Нет никакой разницы в том, назовем ли мы «продукт» картотекой или файлом. Однако со временем обнаружилась одна интересная особенность: если специалист прошел через «традиционный этап», то он знает функции каждого из перечисленных элементов и умеет с ними работать. Хороший электронный каталог получается у опытного каталогизатора, у него и карточные были прекрасными. Правда, он ставит перед программистом гораздо больше задач, нежели каталогизатор, никогда не работавший с карточным каталогом.

О КС можно ничего не говорить – никаких стандартных требований к тому, как с ними работать, не существует. В одних системах (их большинство) КС просто накапливаются, формируется словарь (иногда его может посмотреть пользователь). В других делается попытка «оптимизировать» массив, сделать словарь контролируемым. Насколько это реально помогает поиску?

Хотелось бы наглядно представить преимущества и недостатки различных ИПЯ и соответствующих видов индексирования. Но у нас в стране нет такой библиотеки, которая нашла бы возможность обработать один и тот же массив библиографической информации с помощью нескольких различных ИПЯ. Когда невозможно опереться на реальность, в науке принято использовать метод моделирования.

Мы сделали попытку провести анализ различных языков индексирования в рамках одной и той же предметно-тематической области. Назовем её так: «Чрезвычайные ситуации» (в дальнейшем – ЧС). Пришлось заняться моделированием ИПЯ. Сначала мы поработали с КС, на этой базе представили предметизационный ИПЯ в виде языка ПР, на следующей ступени разработали классификационный ИПЯ и соответствующий аппарат к нему (АПУ и СКК). Завершили нашу работу созданием модели дескрипторного ИПЯ – тезауруса.

Материал оказался объемным, пришлось разделить его на несколько публикаций. Результаты настолько очевидны, что глубокого анализа (можно было бы, например, провести экспериментальный поиск и сравнить результаты) не потребовалось. Судите сами.

 

Язык ключевых слов

В течение одной недели шло накопление КС. Ситуация была приближена к реальной практике: ни к каким специальным справочникам и словарям мы не прибегали: «обрабатывалась» пресса, передачи телевидения, записывалось всё, что относится к обозначенной теме. Когда в списке было заполнено 50 строк, мы приступили к обработке.

Операция первая, формальная. Расставим 50 ключевых слов в алфавитном порядке, не прибегая к инверсии:

Аварии Несчастный случай
Акциденции Обвалы
Бури Обрушения зданий
Взрывы Оползни
Военные действия Пожары
Вулканические извержения Природные аномалии
Выбросы вредных веществ Природные катастрофы
Вынужденная посадка Разрушения зданий и сооружений
Выпадения крупного града Разрывы трубопроводов
Декомпрессии Сели
Дожди Случайность
Дорожно-транспортные происшествия Смерчи
Жара Снегопады
Задымления Степные пожары
Заморозки Стихийные бедствия
Засуха Торнадо
Землетрясения Торфяные пожары
Катастрофы Туманы
Крушения поездов Удары молнии
Лавины Ураганы
Лесные пожары Утечка отравляющих веществ
Ливневые дожди Утечка топлива
Морозы Цунами
Наводнения Чрезвычайные ситуации
Напор льдов Штормы

 

Тот же список можно представить в другом виде, используя метод KWIC (keyword-in-context – ключевое слово в контексте). Посмотрите, как раскрылось содержание, хотя мы к этому специально не стремились:

  Аварии
  Акциденции
Природные аномалии
Стихийные бедствия
  Бури
  Взрывы
Выбросы вредных веществ
Утечка отравляющих веществ
  Военные действия
Выбросы вредных веществ
  Вулканические извержения
  Выбросы вредных веществ
  Вынужденная посадка
  Выпадения крупного града
Выпадения крупного града
Военные действия
  Декомпрессии
  Дожди
Ливневые дожди
  Дорожно-транспортные происшествия
  Жара
  Задымления
  Заморозки
  Засуха
Обрушения зданий
Разрушения зданий и сооружений
  Землетрясения
Вулканические извержения
  Катастрофы
Природные катастрофы
Техногенные катастрофы
Выпадения крупного града
  Крушения поездов
  Лавины
  Лесные пожары
  Ливневые дожди
Разрушения линий электропередач
Напор льдов
Удары молнии
  Морозы
  Наводнения
  Напор льдов
  Несчастный случай
  Обвалы
  Обрушения зданий
  Оползни
Утечка отравляющих веществ
Крушения поездов
  Пожары
Лесные пожары
Степные пожары
Торфяные пожары
Вынужденная посадка
  Природные аномалии
  Природные катастрофы
Дорожно-транспортные происшествия
  Разрушения зданий и сооружений
  Разрушения линий электропередач
  Разрывы трубопроводов
  Сели
Чрезвычайные ситуации
Несчастный случай
  Случайность
  Смерчи
  Снегопады
Разрушения зданий и сооружений
  Степные пожары
  Стихийные бедствия
Утечка топлива
  Торнадо
  Торфяные пожары
Дорожно- транспортные происшествия
Разрывы трубопроводов
  Туманы
  Удары молнии
  Ураганы
  Утечка отравляющих веществ
  Утечка топлива
  Цунами
  Чрезвычайные ситуации
  Штормы
Разрушения линий электропередач

В целях экономии места не будем показывать, как тот же набор ключевых слов можно отобразить, используя метод KWOC (keyword-out-of-context – ключевое слово вне контекста). Он применяется, например, в указателе к Государственному рубрикатору НТИ.

 

Предметизационный ИПЯ

Следующий этап переработки имеющегося массива понятий – составление списка ПР. Мы обязаны выявить синонимы, принять решение о том, какой из них введем в список, а от какого дадим к нему ссылку см. Мы имеем право инверсировать некоторые понятия.

Аварии

  • авиационные
  • автомобильные См. также Дорожно-транспортные происшествия
  • железнодорожные
  • трубопроводного транспорта см. Трубопроводы – аварии

Акциденции см. Случайности

Бури

Взрывы

Военные действия

Вулканические извержения

Вредные вещества – выбросы

Вынужденная посадка см. Аварии – авиационные

Град

Декомпрессия см. Аварии – авиационные

Дожди

Дорожно-транспортные происшествия См. также Аварии – автомобильные

Жара См. также Засуха

Задымления см. Пожары

Заморозки см. Морозы

Засуха

Здания и сооружения – Аварии

Землетрясения

Катастрофы см. Аварии

Крушения поездов см. Аварии – железнодорожные

Лавины

Лесные пожары см. Пожары

Ливневые дожди см. Дожди

Обвалы

Обрушения зданий см. Здания и сооружения – аварии

Оползни

Пожары

  • лесные
  • степные
  • орфяные

Природные аномалии См. также Стихийные бедствия, и под наименованием отдельных аномалий, например, Землетрясения, Вулканические извержения

Природные катастрофы см. Стихийные бедствия

Разрушения зданий и сооружений См. Здания и сооружения – аварии

Льды, напор

Морозы

Наводнения

Напор льдов см. Льды, напор

Несчастный случай см. Аварии

Отравляющие вещества – утечка

Разрывы трубопроводов см. Трубопроводы – Аварии

Сели

Случайность

Смерчи

Снегопады

Степные пожары см. Пожары

Стихийные бедствия

Топливо – утечка

См. Трубопроводы – аварии

Торнадо см. Смерчи

Торфяные пожары см. Пожары

Трубопроводы – Аварии

Туманы

Удары молнии см. Молнии, удары

Ураганы см. Бури

Цунами

Чрезвычайные ситуации

См. также Аварии, Природные аномалии

Штормы см. Бури

 

Если мы сравним перечень КС со списком ПР, то сразу же увидим преимущества предметизационного ИПЯ. Ведь мы вынуждены были провести лексико-семантический анализ языка, выявить скрытые связи и отношения, разобраться с синонимами (Акциденции – Случайности, Торнадо – Смерчи, Бури – Ураганы – Штормы). Использовались, конечно, словари и справочники. Обнаружены слова и словосочетания, по которым искать никто не будет, приняты решения об инверсии.

В следующей статье будет рассмотрен классификационный ИПЯ.

  
На главную