Колобов О.С.
НТБ Томского политехнического
университета
Мешечак Н.А.
Научно-медицинская библиотека
Сибирского государственного
университета, Томск
Карауш А.С.
Муниципальная информационная
библиотечная система, Томск
Представление тезауруса MeSH в
формате RUSMARC посредством протокола Z39.50
Краткое описание основных этапов
работы по представлению MeSH в формате RUSMARC
посредством протокола Z39.50.
|
N+1 причина использования MeSH как
Z39.50 базы данных
Medical Subject
Headings (MeSH) [1] –
контролируемый словарь; используется для
индексирования, каталогизации и поиска
информации и документов по биологии,
медицине и здравоохранению. Существует
множество реализаций программных
приложений, использующих MeSH, и в каждом
предусмотрен сервис поиска в MeSH.
Сочетание MeSH и Z39.50 сегодня
ассоциируется с тем, что данные из MeSH
доступны через Z39.50 протокол. Это позволяет
использовать стандартные решения для
организации поиска и удаленной
предметизации с применением внешнего
тезауруса MeSH. Преимущества такого подхода
очевидны для той категории пользователей,
которые повседневно используют системы,
построенные на основе Z39.50.
Локализация MeSH
К сожалению, при широком
использовании и сопровождении MeSH в
англоязычном мире работа по локализации MeSH
для других языков в NLM [2]
не ведется. Поэтому важно предоставить
возможность использования MeSH
русскоязычным пользователям с учетом того,
что ежегодно NLM дополняет и изменяет MeSH.
Для адаптирования MeSH к
русскоязычной среде выполнен
полуавтоматический перевод главных рубрик
и подрубрик с последующим конвертированием
записи в формат RUSMARC Authority.
При конвертировании сохранена структура MeSH, что позволяет использовать
оригинальные методы навигации внутри
словаря одновременно как на английском, так
и на русском языке. Таким образом
генерируется вариант MeSH, рассчитанный на
русскоязычных пользователей –
локализованный MeSH, который вполне
справляется с основными функциями MeSH как
тезауруса.
MeSH и Z39.50
Если рассматривать MeSH как
тезаурус (семантическая иерархия терминов,
как это описано в ISO 2788 [3]),
то сегодня существует Z39.50 профиль Zthes [4], описывающий эту модель данных. Zthes
профиль определяет не только модель данных
и навигацию для тезауруса, но и формат, и
протокол передачи данных.
Для представления
локализованной версии MeSH в Z39.50 данный
подход не использован из-за дополнительных
затрат на развитие программного
обеспечения. В работе использованы решения,
уже отработанные как с технической, так и
технологической точки зрения.
MeSH исторически создавался и
сопровождался во внутреннем формате NLM MeSH204.
И сегодня NLM использует открытые
коммуникативные форматы для передачи MeSH –
как XML документ, размеченный ASCII файл и как USMARC
Authority файл. Для всех перечисленных
форматов существуют положения о
преобразовании из внутреннего формата MeSH204,
например для USMARC Authority
[5]. Этот факт
позволяет лучше понимать организацию MeSH
через призму другого, знакомого и открытого
формата.
По условиям проекта конечным
форматом представления локализованной
версии MeSH должен быть RUSMARC
Authority. Из доступных форматов формат
представления оригинального MeSH USMARC
Authority является наиболее привлекательным,
поскольку, по опыту и результату работы над
предыдущими проектами ОЭБ [6]
разработано программное обеспечение для
обработки библиографических записей,
представленных в коммуникативных форматах.
Задача представления
локализованной версии MeSH в Z39.50 состояла в
том, что необходимо дополнить профиль
индексирования RUSMARC записей для
авторитетных файлов и добавить поддержку
точки доступа MeSH-subjects из стандартного набора
артибутов Bib-1 [7].
Организация доступа к MeSH
MeSH в среде Z39.50 представляется
как традиционная база данных. Записи могут
быть найдены и извлечены из базы данных
через стандартный сервис поиска и
представления Z39.50 в синтаксисе RUSMARC.
Преимущество такого подхода состоит в том,
что MeSH может быть использован для решения
разнообразных задач например для
расширения пользовательского запроса
нормативными терминами MeSH для задачи
удаленной предметизации с применением MeSH.
В качестве пользовательского
интерфейса для работы с MeSH используется Z39.50
шлюз Научной библиотеки СибГМУ [8], который предоставляет возможность
формировать запрос к электронному каталогу
библиотеки в два этапа. Первый – поиск
нормативного термина в базе данных MeSH,
второй – поиск в электронном каталоге с
указанием ранее найденного нормативного
термина.
Заключение
Использование MeSH в среде Z39.50
открывает возможность интеграции
тезауруса в существующие или во вновь
создаваемые информационно-поисковые
системы.
Важным результатом в работе по
представлению локализованной версии MeSH в
Z39.50 среде является то, что предлагается не
конкретная реализация системы, а
технология использования MeSH для
русскоязычных пользователей.
Список источников
- http://www.nlm.nih.gov/mesh/meshhome.html
- http://www.nlm.nih.gov/nlmhome.html
- International
Organization for Standardization. ISO 2788: Guidelines for the establishment and
development of monolingual thesauri, 2nd ed. Geneva: ISO, 1986. For some
inexplicable and inexcusable reason, ISO standards are not generally available
on-line.
- Zthes:
a Z39.50 Profile for Thesauri Naviagtion
http://zthes.z3950.org/profile
- Conversion Specification for
MeSH to USMARC Authoruty Format
http://www.nlm.nih.gov/mesh/marc99.pdf
- http://www.oel.tomsk.ru
- ftp://ftp.loc.gov/pub/z3950/defs/bib1.txt
- http://z3950.medlib.tomsk.ru
|