Колобов О.С.
НТБ Томского политехнического
университета
Мешечак Н.А.
Научно-медицинская библиотека
Сибирского государственного
университета, Томск
Карауш А.С.
Муниципальная информационная
библиотечная система, Томск
Представление тезауруса MeSH в
формате RUSMARC посредством протокола Z39.50
Краткое описание основных этапов работы по представлению MeSH в формате RUSMARC посредством протокола Z39.50. |
N+1 причина использования MeSH как Z39.50 базы данных
Medical Subject Headings (MeSH) [1] – контролируемый словарь; используется для индексирования, каталогизации и поиска информации и документов по биологии, медицине и здравоохранению. Существует множество реализаций программных приложений, использующих MeSH, и в каждом предусмотрен сервис поиска в MeSH.
Сочетание MeSH и Z39.50 сегодня ассоциируется с тем, что данные из MeSH доступны через Z39.50 протокол. Это позволяет использовать стандартные решения для организации поиска и удаленной предметизации с применением внешнего тезауруса MeSH. Преимущества такого подхода очевидны для той категории пользователей, которые повседневно используют системы, построенные на основе Z39.50.
Локализация MeSH
К сожалению, при широком использовании и сопровождении MeSH в англоязычном мире работа по локализации MeSH для других языков в NLM [2] не ведется. Поэтому важно предоставить возможность использования MeSH русскоязычным пользователям с учетом того, что ежегодно NLM дополняет и изменяет MeSH.
Для адаптирования MeSH к русскоязычной среде выполнен полуавтоматический перевод главных рубрик и подрубрик с последующим конвертированием записи в формат RUSMARC Authority. При конвертировании сохранена структура MeSH, что позволяет использовать оригинальные методы навигации внутри словаря одновременно как на английском, так и на русском языке. Таким образом генерируется вариант MeSH, рассчитанный на русскоязычных пользователей – локализованный MeSH, который вполне справляется с основными функциями MeSH как тезауруса.
MeSH и Z39.50
Если рассматривать MeSH как тезаурус (семантическая иерархия терминов, как это описано в ISO 2788 [3]), то сегодня существует Z39.50 профиль Zthes [4], описывающий эту модель данных. Zthes профиль определяет не только модель данных и навигацию для тезауруса, но и формат, и протокол передачи данных.
Для представления локализованной версии MeSH в Z39.50 данный подход не использован из-за дополнительных затрат на развитие программного обеспечения. В работе использованы решения, уже отработанные как с технической, так и технологической точки зрения.
MeSH исторически создавался и сопровождался во внутреннем формате NLM MeSH204. И сегодня NLM использует открытые коммуникативные форматы для передачи MeSH – как XML документ, размеченный ASCII файл и как USMARC Authority файл. Для всех перечисленных форматов существуют положения о преобразовании из внутреннего формата MeSH204, например для USMARC Authority [5]. Этот факт позволяет лучше понимать организацию MeSH через призму другого, знакомого и открытого формата.
По условиям проекта конечным форматом представления локализованной версии MeSH должен быть RUSMARC Authority. Из доступных форматов формат представления оригинального MeSH USMARC Authority является наиболее привлекательным, поскольку, по опыту и результату работы над предыдущими проектами ОЭБ [6] разработано программное обеспечение для обработки библиографических записей, представленных в коммуникативных форматах.
Задача представления локализованной версии MeSH в Z39.50 состояла в том, что необходимо дополнить профиль индексирования RUSMARC записей для авторитетных файлов и добавить поддержку точки доступа MeSH-subjects из стандартного набора артибутов Bib-1 [7].
Организация доступа к MeSH
MeSH в среде Z39.50 представляется как традиционная база данных. Записи могут быть найдены и извлечены из базы данных через стандартный сервис поиска и представления Z39.50 в синтаксисе RUSMARC. Преимущество такого подхода состоит в том, что MeSH может быть использован для решения разнообразных задач например для расширения пользовательского запроса нормативными терминами MeSH для задачи удаленной предметизации с применением MeSH.
В качестве пользовательского интерфейса для работы с MeSH используется Z39.50 шлюз Научной библиотеки СибГМУ [8], который предоставляет возможность формировать запрос к электронному каталогу библиотеки в два этапа. Первый – поиск нормативного термина в базе данных MeSH, второй – поиск в электронном каталоге с указанием ранее найденного нормативного термина.
Заключение
Использование MeSH в среде Z39.50 открывает возможность интеграции тезауруса в существующие или во вновь создаваемые информационно-поисковые системы.
Важным результатом в работе по представлению локализованной версии MeSH в Z39.50 среде является то, что предлагается не конкретная реализация системы, а технология использования MeSH для русскоязычных пользователей.
Список источников