О. Л. Жижимов
Институт вычислительных технологий
СО РАН, Новосибирск
Н. А. Мазов
Институт нефтегазовой геологии и геофизики
им. акад. А. А. Трофимука СО РАН, Новосибирск
Об использовании географических координат
при поиске библиографической информации
Рассмотрены некоторые аспекты поиска информации по критериям, задаваемым географическими координатами; возможности различных систем метаданных (MARC21, RUSmarc, GILS, GEO), способы построения поисковых запросов и их представление в стандартизованном виде. В качестве иллюстрации представлены интерфейсы шлюза Z39.50 – WWW ZooPARK.
Сегодня географические координаты объектов могут присутствовать в метаданных (описаниях объектов) в соответствии с различными стандартами описания объектов.
Наиболее известные схемы данных (схемы описания объектов), содержащие поля с географическими координатами:
1. USMARC, MARC21 – американский стандарт на библиографические описания различных объектов, ориентированный на структуру стандарта ISO–2709. В табл. 1 представлен фрагмент описаний полей с примерами представления географических координат в формате MARC21.
Таблица 1
Поле |
Подполе |
Описание |
Примеры |
034 |
$d – западная долгота $e – восточная долгота $f – северная широта $g – южнаяширота
|
Coded Cartographic Mathematical Data. Подполя $d, $e, $f, и $g всегда присутствуют вместе. Координаты могут быть записаны в форме hdddmmss (полушарие-градусы-минуты-секунды), однако другие формы записи также допустимы. Выравненные вправо подэлементы заполняются лидирующими нулями. Односимвольный код полушария: W(-) = запад, E(+) = восток, N(+) = север, S(-) = юг. Возможны обозначения +/-. Лидирующий символ + может быть опущен. |
hdddmmss: 1#$aa$b22000000$dW1800000$eE1800000$fN0840000$gS0700000 hddd. dddddd: 1#$aa$dE079. 533265$eE086. 216635$fS012. 583377$gS020. 419532 +-ddd. dddddd: 1#$aa$d+079. 533265$e+086. 216635$f-012. 583377$g-020. 419532 Без лидирующего + 1#$aa$d079. 533265$e086. 216635$f-012. 583377$g-020. 419532 hdddmm. mmmm: 1#$aa$dE07932. 5332$eE08607. 4478$fS01235. 5421$gS02028. 9704 hdddmmss. sss: 1#$aa$dE0793235. 575$eE0860727. 350$fS0123536. 895$gS0202858. 125 |
255 |
$с – сведения о координатах. |
Cartographic Mathematical Data |
##$aScale 1:41,849,600$c(W 180°--E 180°/N 90°--S 90°). |
В табл. 2 представлен пример описания картографического материала в формате MARC21. Запись иллюстрирует заполнение полей, относящихся к картографическим материалам: поле 034 (CodedCartographicMathematicalData) и поле 255 (CartographicMathematicalData).
Таблица 2
Поле |
Содержание |
Leader/00-23 |
*****cem##22*****#a#4500 |
001 |
<control number> |
003 |
<control number identifier> |
005 |
19920506101053. 0 |
007/00-05 |
dc#cen |
008/00-39 |
850203c19841980dk#g######d#####1###eng## |
034 |
1#$aa$b41849600$dW1800000$eE1800000$fN0900000$gS0900000 |
040 |
##$a[organization code]$c[organization code] |
052 |
##$a3170 |
100 |
1#$aHarig, Karl-F. |
245 |
10$aReader's Digest world antique spot globe /$ccartography by Karl-F. Harig. |
246 |
14$aReader's Digest world antique spot globe: encyclopedic handbook. |
255 |
##$aScale 1:41,849,600$c(W 180°--E 180°/N 90°--S 90°). |
260 |
##$a[Copenhagen] Denmark:$bScan-Globe, $cc1984, c1980. |
300 |
##$a1 globe:$bcol., plastic, mounted on plastic base; $c31 cm. in diam. |
500 |
##$aRelief shown by spot heights. |
500 |
##$aCover title of accompanying text: Reader's Digest world antique spot globe:encyclopedic handbook. |
500 |
##$aGlobe lights up from inside by means of detachable electric cord and interior light bulb. |
500 |
##$aWhen the globe is lit, any place on earth can be pinpointed if the latitude and longitude are known. When these two facts are given, it is possible to adjust the two scales to the given figures of latitude and longitude. It causes a pinpoint of light to indicate where the place lies. |
500 |
##$aAccompanied by text and index: Spot globe 2000 edited by Steen B. Bocher and Henrik B. Hoffmeyer. 17th ed.,1983. 168 p.: ill., maps; 15 x 21 cm. |
650 |
#0$aGlobes. |
700 |
1#$aBocher, Steen Bugge, $d1906- |
700 |
1#$aHoffmeyer, Henrik B. |
710 |
2#$aReader's Digest Association. |
710 |
2#$aScan-Globe A/S. |
730 |
01$aSpot globe 2000. |
2. RUSMARC – российский вариант схемы описания библиографических данных UNIMARC, ориентированный на структуру ISO–2709, учитывающий национальные правила каталогизации. Географические координаты могут присутствовать в полях 123 и 206. В табл. 3 представлены описание и примеры заполнения соответствующих полей.
Таблица 3
Поле |
Подполе |
Описание |
Примеры |
123 |
$d – западная долгота $e – восточная долгота $f – северная широта $g – южная широта
|
Координаты для планетарных и земных картографических материалов. Обязательное для картографических материалов. Повторяется, если материал содержит данные в различных масштабах и с разными координатами. Каждое подполе координат ($d-$g) имеет фиксированную длину в 8 символов и не повторяется. Каждое подполе содержит следующие данные: Позиция
символа 0. Стороны света. Позиции
символов 1-3. Градусы. Позиции
символов 4-5. Минуты. – Позиции символов 6-7. Секунды. |
123 2#$aa$b150000$b25000$de0150000$ee0173045$fn0013012$gs0023035 Часть карты Заира с линейными масштабами 1:150000 и 1: 25000, долгота – от 15oВ до 17o30'45» В, широта – от 1o30'12» С до 2o30'35» Ю.
|
206 |
$d – сведения о координатах. Факультативное, не повторяется |
Обязательное для картографических материалов. Индикатор 1: Определяет, структурированы ли данные в поле # –
Данные представлены в неструктурированном виде Индикатор 2: # (не определен) |
Неcтруктурированное представление 206 ##$aScale 1: 6 336 000 (W 170o -W 50o/N 80o -N 40o) Структурированное представление 206 0#$bScale 1: 6 336 000$d(W 170o -W 50o/N 80o -N 40o) |
Следует заметить, что поле 123 содержит те же данные о масштабе и координатах, которые записываются в поле 206, но в кодированной форме. Нужно также обратить внимание, что представление координат в поле 123 в RUSMARC совместимо с представлением MARC21 (поле 034). Однако обратной совместимости нет! Возможности представления координат в MARC21 существенно шире и не ограничены жестким форматом.
3. Схема GILS – Goverment Internet Locator Service [2].
Элемент схемы |
Содержание |
(4,71) |
spatialDomain |
(4,71)/(4,91) |
boundingCoordinates |
(4,71)/(4,91)/(4,9) |
westBoundingCoordinate |
(4,71)/(4,91)/(4,10) |
eastBoundingCoordinate |
(4,71)/(4,91)/(4,11) |
northBoundingCoordinate |
(4,71)/(4,91)/(4,12) |
southBoundingCoordinate |
Форма представления координат в схеме GILS соответствует форме MARC21.
4. Схема CIMI – Computer Interchange of Museum Information
Элемент схемы |
Содержание |
(4,4) |
objectInfo |
(4,4)(4,14) |
digitalObject |
(4,4)(4,14)(4,29) |
actualDo |
(4,4)(4,14)(4,29)(5,58) |
xCoordinateInSpatialReferencingSystem |
(4,4)(4,14)(4,29)(5,59) |
yCoordinateInSpatialReferencingSystem |
5. GEO – профиль Z39.50 [1,3,4], соответствующий стандарту представления пространственных метаданных FGDCContentStandards. В табл. 4 приведено соотношение полей, содержащих граничные географические координаты для профиля Z39.50 GEO, стандарта FGDC Content Standards и MARC21.
Таблица 4
Элемент схемы |
Содержание |
FGDC |
MARC21 |
idinfo/spdom/bounding/westbc |
West Bounding Coordinate |
1. 5. 1. 1 |
034 d |
idinfo/spdom/bounding/eastbc |
East Bounding Coordinate |
1. 5. 1. 2 |
034 e |
idinfo/spdom/bounding/northbc |
North Bounding Coordinate |
1. 5. 1. 3 |
034 f |
idinfo/spdom/bounding/southbc |
South Bounding Coordinate |
1. 5. 1. 4 |
034 g |
Форма представления координат для профиля GEO соответствует форме MARC21.
Потенциальная возможность присутствия полей координат в записях не означает их действительного наличия. Наполнение записей показывает отсутствие необходимых полей в большинстве библиографических БД. Исключения составляют:
база данных GeoRef, содержащая описания литературных источников за большой временной период (более 100 лет);
базы данных FGDC [5–7], изначально ориентированные на хранение описательной информации по объектам с географической привязкой.
Для работы с географической составляющей названных баз данных необходим специальный подход, применяемый сегодня в ГИС-системах. Один из основных аспектов этого подхода – создание подсистем поиска информации по географическим координатам методом формирования в пользовательских интерфейсах специальных поисковых примитивов (геометрических структур, фиксирующих границы поискового запроса) и реализации алгоритмов конвертирования пользовательских геометрических примитивов в логические операнды, составляющие поисковый запрос к базам данных.
Поскольку единственным стандартом, регламентирующим унифицированный доступ к гетерогенным базам данных, сегодня является Z39.50 и его специальные клоны, например CIP для доступа к данным по объектам с географической привязкой, естественной основой для построения соответствующих поисковых подсистем служит методика отображения графических поисковых запросов в логику RPN-запросов Z39.50, оперирующую поисковыми атрибутами, объединенными в большие стандартизованные группы – наборы поисковых атрибутов.
Поисковые атрибуты USE для различных наборов поисковых атрибутов, имеющие отношение к географическому поиску, в табл. 5.
Таблица 5
Bib-1 |
GILS |
GEO |
Название |
1118 |
2038 |
2038 |
West Bounding Coordinate |
1119 |
2039 |
2039 |
East Bounding Coordinate |
1120 |
2040 |
2040 |
North Bounding Coordinate |
1121 |
2041 |
2041 |
South Bounding Coordinate |
Приведенный ниже фрагмент запроса RPN на поиск информации в прямоугольнике с заданными граничными координатами
выглядит следующим образом (нотация PQF, принятая в продуктах IndexData и сервере ZooPARK)
@and @and @and @attr bib1 1=1118 @attr 2=4 @attr 4=109 w1
@attr bib1 1=1119 @attr 2=2 @attr 4=109 e1
@attr bib1 1=1120 @attr 2=2 @attr 4=109 n1
@attr bib1 1=1121 @attr 2=4 @attr 4=109 s1
Как пример реализации подсистемы географического поиска библиографической информации можно привести ссылку на шлюз Z39.50-HTTP сервера ZooPARK Сибирского отделения РАН (http://z3950. nsc.ru:210). Поиск производится по координатам, задаваемым вершинами прямоугольника на масштабируемой карте. В настоящей реализации используется GoogleMap.
В заключение отметим, что представленная работа актуальна в связи с тем, что в настоящее время все большее значение приобретают различные геоинформационные системы, интегрирующие пространственную атрибутивную информацию. Поэтому использование библиографических данных в качестве дополнительных атрибутов подобных систем, на наш взгляд, перспективно. Несомненно, это должно находить отражение в стандартах и рекомендациях на подготовку и представление библиографической информации.
Список источников
1. ANSI/NISOZ39.50–1995. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification / Z39.50 Maintenance Agency Offical Text for Z39.50–1995. – July 1995.
2. Application Profile for the Government Information Locator Service (GILS), Version 2, November 24, 1997. (http://www.gils.net/prof_v2.html).
3. Douglas D. Nebert. Z39.50 Application Profile for Geospatial Metadata or «GEO» / Version 2. 2 / U. S. Federal Geographic Data Committee (http://www.blueangeltech. com/Standards/ GeoProfile/geo22.htm).
4. Content Standard for Digital Geospatial Metadata (http://www.fgdc. gov/metadata/ contstan.html).
5. FGDC – Federal Geographic Data Committee (http://www.fgdc.gov).
6. Crosswalk: USMARC to FGDC Content Standards for Digital Geospatial Metadata. – [электронныйресурс] http://www.alexandria.ucsb.edu/public-documents/metadata/marc2fgdc.html
7. Crosswalk: FGDC Content Standards for Digital Geospatial Metadata to USMARC. – [электронныйресурс] http://www.alexandria.ucsb.edu/public-documents/metadata/fgdc2marc.html