Home page | Каталоги и базы данных

Научные и технические библиотеки
Шарон Т., Франк А.

Университет Бар-Илан, г. Рамат Ган, Израиль

Электронные библиотеки в Интернете

Доклад 029—142 на 66-й Генеральной конференции ИФЛА (13—18 авг. 2000 г., г. Иерусалим, Израиль)

Скачкообразное развитие Интернета в последние годы ускоряет наступление информационного взрыва — явления, хорошо знакомого специалистам. Поисковые машины Интернета (на февраль 1999 г. их насчитывалось 2 400) дают возможность войти в киберпространство и в то же время обрушивают на нас лавину ненужной информации.

По данным журнала "Нэчур" (Nature) в сети на февраль 1999 г. находилось примерно 800 млн проиндексированных страниц. При этом охват поисковыми машинами имеющегося в сети электронного материала невелик: ни одна машина не дает доступа более чем к 16% ресурсов сети по конкретной тематике.

Сегодня многие склонны считать саму сеть Интернет мировой виртуальной библиотекой. Правилен ли такой подход?

В любом случае Интернет и поисковые машины не заменят нам любимые классические библиотеки. Оглядываясь назад, мы можем условно разделить библиотеки на три типа:

  • аналоговая (бумажная) библиотека, т. е. классическая бумажная библиотека с карточными каталогами;

  • автоматизированная (гибридная) библиотека, т. е. аналоговая библиотека, имеющая компьютерный электронный каталог;

  • электронная (цифровая) библиотека, т. е. автоматизированная библиотека, в которой значительная часть информации находится в электронном формате.

Проблемы обычных библиотек хорошо известны и нет необходимости их специально детализировать. Однако не совсем ясно, что представляют собой электронные библиотеки и каковы их характерные черты.

Для начала предлагаем классифицировать электронные библиотеки и разделить их на три категории:

  • отдельная электронная библиотека (Single Digital Library) — обычная классическая библиотека, при этом полностью автоматизированная;

  • интегрированная электронная библиотека (Federated Digital Library) — группа из нескольких независимых библиотек, объединенных общей тематикой и коммуникационной сетью;

  • сборная электронная библиотека (Harvested Digital Library) — виртуальная библиотека, предоставляющая единообразный доступ к разбросанным по сети ресурсам и тематическим материалам.

Далее мы сопоставим различные типы библиотек и сконцентрируемся на сравнении последнего типа (сборная электронная библиотека) с поисковыми машинами сети. В качестве образца может служить электронная библиотека Кацир, основанная на сборной системе, которая недавно разработана в университете Бар-Илана.

 

 

Иерархия хранилищ ресурсов

Как поисковые машины, так и электронные библиотеки являются инструментами поиска в Интернете. Мы вводим иерархию хранилищ ресурса на основе выбора между поисковыми машинами и электронными библиотеками. При этом поисковые машины группируются в три категории:

  • основные поисковые машины (индексированный подход) — инструмент, который использует автоматический робот — краулер для подбора материалов по конкретной тематике;

  • каталог (руководство) — инструмент, в котором подбор материала и его каталогизацию осуществляют люди;

  • мета-поисковая машина — инструмент, не содержащий собственных баз данных, а обращающийся к машинам первого типа для удовлетворения запроса пользователя.

 

 

Что такое библиотека

Прежде чем заняться цифровой библиотекой, попытаемся найти определение библиотеки вообще. Отметим шесть базовых характеристик библиотек:

 

Набор объектов. Любая библиотека создает наборы данных, часто называемых фондами, экземплярами, ресурсами или просто материалом. Таковыми могут быть книги, журналы, документы (например страницы HTML); мультимедийные объекты (картины, изображения, магнитные ленты, видеофильмы и т.п.). Объекты должны быть доступны либо непосредственно в библиотеке, либо через какую-то сеть.

 

Набор метаданных. В библиотеке обычно имеются метаданные: каталоги, руководства, словари, тезаурусы, указатели, рефераты, обзоры, подборки и т. п.

 

Набор служб. В их числе различные средства доступа (поиск, просмотр и т. п.) с учетом категорий и интересов читателей, системы дифференцированного распространения информации, менеджмент библиотеки, статистика, оценка эффективности и т.д.

 

Область интересов. Каждой библиотеке свойственна определенная область интересов, в соответствии с которой и формируются фонды. Например: искусство, наука, литература. Обычно библиотеки создаются для определенной категории пользователей: академические, публичные, специальные, школьные, национальные или государственные.

 

Контроль качества. В данном случае имеется в виду тщательная проверка фондов на соответствие профилю библиотеки. Поступающий материал фильтруется перед включением в фонды. Постоянно пополняются библиографические ресурсы путем создания библиографических записей, указателей, рефератов и т. п.

 

Сохранность. Библиотеки и архивы являются центрами сохранности — это одна из ключевых функций. Цель процедур сохранности — обеспечить защиту информации и доступ к ней будущих поколений; подразумевается регулярная инспекция материалов для выявления ухудшения состояния; профилактика, а в случае необходимости — восстановительные процедуры.

 

 

От традиционной библиотеки — к электронной

В любом случае Интернет и поисковые машины не заменяют любимую классическую библиотеку. И концепция бумажной библиотеки, и различные системы обслуживания достаточно хорошо отработаны. Идея состоит в том, что электронные библиотеки могут дать разнообразные поисковые средства, позволяющие более точно найти искомый материал, более эффективный выход на вновь созданное знание, доступ к мультимедийным ресурсам.

 

 

Электронные библиотеки

Напомним, что отдельная электронная библиотека имеет фонды в цифровой форме (как результат сканирования или оцифровки). Такая библиотека самоограничена, поскольку материалы в ней находятся в одном месте. По сути это компьютеризованная версия классической библиотеки. В качестве примеров можно назвать Библиотеку Конгресса США или израильскую библиотеку Снунит для средней школы.

Сеть, состоящую из нескольких независимых электронных библиотек, объединенных общей тематикой, мы называем интегрированной электронной библиотекой. Входящие в нее библиотеки разнородны, в них могут применяться самые разнообразные форматы метаданных и стандартов. Наиболее серьезной проблемой для таких библиотек является взаимодействие, поэтому принципиально важным является наличие единого интерфейса.

Примерами интегрированных систем могут быть Сетевая библиотека по компьютерным наукам и Сетевая библиотека по диссертациям и авторефератам.

Сборная электронная библиотека комплектует только метаданные с указателями путей выхода на соответствующие фонды, поэтому одним движением "мыши" вы можете войти в киберпространство, содержащее резюме материалов выбранной вами тематики. В то же время все признаки и характеристики библиотеки остаются нетронутыми, включая структурирование материала и возможность провести точный, сфокусированный поиск, разнообразие форм обслуживания, тщательный контроль качества. Информационные специалисты — сотрудники сборной библиотеки отвечают за квалифицированное реферирование материала. Примерами сборной библиотеки могут служить Публичная библиотека Интернет и Виртуальная библиотека Сети.

Рассмотрим различия между типами библиотек. В отдельной электронной библиотеке, равно как и в интегрированной, материалы комплектуются изначально в электронной форме или проводится сканирование печатных документов; при этом сами материалы хранятся тут же — либо в одной библиотеке, либо в нескольких. Все они доступны через Сеть. Здесь же располагается и метаинформация, т.е. справочно-поисковый аппарат. Материалы обновляются постоянно таким же образом, как и в классических библиотеках. Хранилища этих библиотек достаточно громоздки.

Материалы же сборной библиотеки отбираются из Сети, они разбросаны по многочисленным серверам; доступ к ним осуществляется через хорошо известные протоколы — HTTP, FTP и т. п. В самой же библиотеке находятся только метаданные, поэтому хранилище невелико и компактно. Работники библиотеки не участвуют в процессе обновления материалов, им лишь нужно вовремя отслеживать изменения и отражать их в соответствующих аннотациях — либо ручным способом, либо через определенные автоматизированные процедуры. Следует отметить, что профиль сборной библиотеки может быть изменен или дополнен достаточно легко.

 

 

Модель сборной библиотеки

Мы хотели бы дать пример логически связной модели сборной библиотеки, включающей технологические процессы, хранилища данных и вспомогательные хранилища.

Информационный специалист инициирует процесс сбора посредством формулирования соответствующего запроса. Сформированный таким образом запрос передается в поисковую машину, которая подбирает соответствующие данной тематике универсальные адреса электронных ресурсов Сети. На следующем этапе осуществляется структурирование и фильтрация отобранного материала. Многоступенчатая фильтрация обеспечивает релевантность отобранного материала. На первом этапе фильтрации сравниваются ключевые слова запроса со словами из набора подробного Интернет-адреса материала. На втором этапе проводится статистический анализ спрашиваемости, на третьем — документ классифицируется и проверяется на соответствие тематическим категориям электронной библиотеки. Таким образом удается во многом избавиться от "информационного шума".

Отобранные документы поступают на обобщение, составление реферата (аннотации), а затем на индексацию. После этого информационный специалист осуществляет окончательное структурирование набора материалов, создавая "дерево поиска" и тематические подборки. Завершает работу системный специалист, создающий дружественный пользователю интерфейс.

В качестве примера можно назвать сборную библиотеку Кацир, разработанную в университете Бар-Илана департаментом математики и компьютерных наук совместно с департаментом информационных наук.

С учетом огромного количества накопленной информации Интернет рассматривается многими специалистами как мировая виртуальная библиотека — но в какой мере этот подход оправдан?

Мы уже сопоставили поисковые машины с электронными библиотеками: их объединяет наличие пользовательского интерфейса, средств поиска, доступ к сети. Схожесть поисковых машин со сборными библиотеками и в том, что обе рассматриваемые системы содержат метаданные, а не сами полнотекстовые документы; ресурсы отбираются не вручную, а автоматически.

 

 

Поисковые машины в сравнении с электронными библиотеками

Идеология поисковой машины заключается в том, чтобы обеспечить доступ к наибольшему числу электронных ресурсов; поддерживаются самые разнообразные структуры данных, в том числе указатели, директории, каталоги. Поисковые возможности поддерживаются мощным интерфейсом пользователя. Используются также самые разнообразные типы роботов (краулеров) для организации постоянного поиска ресурсов в Интернете и для динамичного обновления материалов. Если взглянуть на пользовательскую часть поисковой машины, то мы увидим, что при выполнении задания пользователя машина опирается на случайным образом составленный запрос на основе ряда ключевых слов (может быть, так или иначе скомбинированных). Результатом поиска будет огромное количество материала, возможно, и нерелевантного. Этот массив обрушится на пользователя — ему придется самым утомительным образом осуществлять вручную фильтрацию выданного материала. Найденная информация затем будет либо немедленно использована, либо передана на относительно краткосрочное хранение.

Электронная библиотека работает несколько другим образом. Информационный специалист создает хорошо продуманную систему качественных, тщательно подобранных материалов. Система отбора и соответствующие запросы определены самым четким образом, а эффективная работа с системой ключевых слов обеспечивает точность поиска и отбора информации. Содержимое библиотеки раскрывается через хорошо структурированную базу данных. Содержание (материалы) электронной библиотеки постоянно обновляется и аннотируется специалистами, что обеспечивает релевантность извлеченных ресурсов.

Пользователь получает сравнительно небольшой, компактный массив информации, который можно сгруппировать следующим образом: метаданные и обобщения, дополнительные рефераты материалов, отреферированный документ. Никакого дополнительного отсеивания не требуется. При необходимости пользователь может сам еще раз прореферировать полученный материал для удобства последующих поисков.

Итак, поисковая машина снабжает пользователя большим количеством нефильтрованной информации и вынуждает его активно поработать по доводке полученного материала; этот метод подходит для однократной и быстрой отгрузки информации.

Электронная библиотека не требует больших затрат труда, предоставляя пользователю более сконцентрированную высококачественную информацию, которая заранее проработана и размечена специалистами.

Эти два способа поиска информации не конфликтуют, а дополняют друг друга.

 

Заключение

Схожесть и различия поисковых машин и электронных библиотек нами проанализированы, однако тенденции их развития требуют дальнейшего изучения. Нужно исследовать проблемы надежности этих систем, рассмотреть их работу с мультимедийным ресурсом, роль изначальной специализации библиотеки в точности тематического поиска и другие аспекты, связанные с улучшением обслуживания пользователей Сети.

 

 

 

К юбилею А.Г. Захарова

 

20 февраля 2001 г. Александру Григорьевичу Захарову исполнилось 80 лет!

А.Г. Захаров — кандидат технических наук, почетный академик Академии космонавтики России, заместитель председателя Информационно-библиотечного совета РАН, заслуженный работник культуры, автор более 200 научных трудов.

С 1973 г. А.Г. Захаров возглавляет Библиотеку по естественным наукам РАН.

За боевые заслуги и успешное руководство ЦБС БЕН РАН А.Г. Захаров награжден 25 орденами и медалями.

 

Глубокоуважаемый Александр Григорьевич!

Поздравляем Вас со славным юбилеем!

От всей души желаем доброго здоровья, благополучия и, конечно, успешного воплощения новых творческих планов.

Надеемся на долгие годы дальнейшего сотрудничества.

Редколлегия и редакция


Copyright © 1995-2001 ГПНТБ России