Научные и технические библиотеки №9 2004 год
Содержание:

Карташов Н.С. Механизм разработки региональных библиотечных программ

Дрешер Ю.Н., Атланова Т.А. Корпоративное управление и корпоративная культура в библиотечно-информационной сфере

Захаров А.Г., Алексеев Н.Г. Научная библиотека РАН – элемент метасистемы «Наука»

Сукиасян Э.Р. Сравнительный анализ моделей различных ИПЯ. Статья 1

Мельникова А.А. Комплектование в условиях рынка: взаимодействие библиотек вузов и книготорговых фирм

Осетрова О.В. «Организация информационного обеспечения исследователей в научных библиотеках» – факультативный курс

Гусак О.А., Езова С.А. Самоменеджмент руководителя библиотеки

Нгуен Тхи Донг. Национальная библиотека Вьетнама и проблема подготовки библиотечных работников


24-я КОНФЕРЕНЦИЯ МЕЖДУНАРОДНОЙ АССОЦИАЦИИ БИБЛИОТЕК ТЕХНИЧЕСКИХ УНИВЕРСИТЕТОВ

Виттен И. Программное обеспечение процесса формирования электронной библиотеки

Криль Х. Маркетинг партнерства: новый подход к обеспечению устойчивого развития электронной библиотеки


ЮБИЛЕИ

Пашина Н.А. Научной библиотеке Курского государственного технического университета – 40 лет

Варганова Г.В. Библиотечной серии издательства «Профессия» – 5 лет


ОБЗОРЫ. РЕЦЕНЗИИ

Соколинский Е.К. Новый международный проект

Коломейчук Е.М. Опыт информационно-библиотечной системы Российской академии наук и проблемы управления деятельностью библиотек


ИНФОРМАЦИОННЫЕ СООБЩЕНИЯ

Мелентьева Ю.П. Международная книговедческая конференция «Книга и мировая цивилизация»


НАШИ
АВТОРЫ


24-я КОНФЕРЕНЦИЯ МЕЖДУНАРОДНОЙ
АССОЦИАЦИИ БИБЛИОТЕК ТЕХНИЧЕСКИХ
УНИВЕРСИТЕТОВ

УДК 025:65.011.56

Виттен И.

Программное обеспечение процесса формирования
фонда электронной библиотеки

Доклад на 24-й конференции Международной ассоциации библиотек технических университетов – IATUL 2–5 июня 2003 г., Анкара, Турция

Программный продукт Гринстон (Greenstone) задумывался с целью оказания помощи в простом и быстром создании фондов электронных библиотек.

ЭБ могут быть очень большими – включать в себя гигабайты текстового материала, но могут состоять всего лишь из нескольких документов. Кроме того, к крупным ЭБ могут быть «прицеплены» коллекции аудио– и видеоматериалов и т.п.

Гринстон является по сути своей международной и многоязычной программой – она широко используется во многих странах, работает со многими языками как по видам интерфейсов, так и языка коллекций. Этот программный продукт распространяется ЮНЕСКО в рамках известной программы «Информация для всех».

Гринстон – многоплатформенная программа (лучше сказать – независимая от платформы), работающая с операционными системам Windows всех типов: Unix, Macintosh OS/X; распространяется через Интернет или как самоустанавливающийся продукт на оптическом диске CD–ROM.

Основную работу по установке программы Гринстон и формированию стандартной коллекции из новых материалов со стандартным интерфейсом можно выполнить буквально за несколько минут. После этого нужно провести достаточно трудоемкую механическую работу по непосредственному вводу полнотекстовых документов в созданную оболочку, что составит от нескольких минут, если у вас небольшой фонд, и до нескольких часов – при большом фонде, объемом во много гигабайт. Такая работа может занять целый день, если приходится вводить много полнотекстовых указателей.

Электронный фонд можно построить в самом различном оформлении, в соответствии с вашими желаниями и представлениями об удобном и прекрасном. При этом, конечно, нужно учитывать, что некоторые типы фондов, особенно значительные по объему, имеют свои неповторимые черты и специфические требования.

Окончательный выбор оформления и отладка могут занять несколько дней (и больше), если вы будете неоднократно каждый раз переделывать оформление интерфейса по ходу практических испытаний.

Конечно, по мере роста общего электронного фонда и увеличения количества отдельных собраний внутри него может оказаться полезным переиначить весь фонд по образу и подобию какого-либо определенного собрания внутри фонда, или вы пожелаете повторить какой-то понравившийся вам тип оформления из уже существующих фондов. Гринстон позволяет легко и просто проводить такого рода модернизацию. Кроме того, с программой Гринстон можно также очень легко повторить (или перенести на другой сайт) оформление вашего интерфейса в другой библиотеке.

Предоставляемые Гринстон сервисы и разнообразие видов интерфейса при осуществлении поиска и просмотра могут адаптироваться на многих уровнях под конкретные нужды. Пользователи могут легко настроиться на различные операционные системы и различные форматы документов (например, HTML, Word, PDF, PostScript, Power Point, Excel). При наличии готовых метаданных (например, в составе файлов XML, открытого архива OAI, библиографии в формате Latex) они включаются в состав записи. Если существует необходимость добавить поисковые индексы (например, специально выделить язык полнотекстовых документов или какие-либо метаданные, допустим заглавия), все это также предусмотрено Гринстон. Пользователь располагает возможностью формировать элементы структурного поиска и просмотра, в том числе список авторов, наименований, классификационные иерархии и т.п.

Электронные библиотеки по сравнению с другими интерактивными системами обладают существенным преимуществом – соответствующие пользовательские интерфейсы опираются на использование метаданных. Метаданные – это «клей», с помощью которого новые документы включаются в состав электронного фонда и немедленно становятся его полноправными элементами. Метаданные – это ключ к обеспечению поиска и просмотра. В программу Гринстон заложено несколько различных механизмов, позволяющих в полной мере воспользоваться этими инструментами.

 

Формирование фонда электронной библиотеки

С помощью программы Гринстон осуществляется индивидуальный подход к созданию фонда ЭБ. Например, по образу какой-либо из уже существующих в конкретной библиотеке коллекций, которая в наибольшей степени соответствует вашим (и ваших пользователей) потребностям, с использованием Гринстон можно легко и просто повторить структуру понравившегося образца. Создается и записывается так называемый короткий конфигурационный файл. В него включаются такие параметры, как название коллекции, адрес электронной почты ее создателя (ответственного лица), описание целей и принципов создания, форматы файлов ввода данных, источники метаданных, в каком формате метаданные записываются, как будет выглядеть пользовательский интерфейс.

Значительная часть информации, связанной с подстройкой программы Гринстон и не относящейся к профессиональному перепрограммированию, будет храниться в этом файле. Его формирование самым существенным образом зависит от наличия метаданных.

 

Поиск по полному тексту всего фонда – основная особенность этой программы, который по умолчанию включается во все формируемые части фонда. Его создатели сами должны определиться, нужен ли им поиск по параграфу (абзацу), разделу документа или по всему тексту документа (этот параметр потом скажется при выдаче результатов поиска). Конструктор может также заказать, чтобы индексы полнотекстового поиска были встроены в систему метаданных. Допускается дробление фонда на части, внутри которых также можно проводить полнотекстовый поиск. Можно проставить и языковые метаданные – поиск будет проводиться в пределах заранее выбранного языка.

 

Возможности для просмотра достаточно существенно различаются в зависимости от имеющихся метаданных и тех видов обслуживания, которые заложил конструктор системы. В программу Гринстон входят заранее определенные структуры, основанные на том или ином виде метаданных.

Любые текстовые метаданные можно представить в виде алфавитного списка, который автоматически подключается в разумных пределах для того, чтобы в каждой демонстрируемой части оказалось приемлемое количество документов.

Данные, касающиеся времени (например год публикации), также формируются в список, что предоставляет пользователю возможность выбрать нужный интервал, осуществить выборку по годам или по месяцам.

Метаданные, имеющие иерархическую структуру, например библиотечные классификационные системы, могут быть реализованы в виде дерева с возможностью переходить по нужным уровням обобщения. В этом случае пользователь должен сформировать дополнительный файл с указанием соответствия (например, предметные рубрики сопоставлены с классификационными номерами).

 

Указания по форматированию необходимы для того, чтобы пользователь смог настроить под свои требования каждый «экран» (каждую картинку), который система генерирует. В этом документе указывается, в каком порядке осуществляется демонстрация – идет ли сначала заголовок отдельной картинкой или просто заголовок с отступом предваряет текст и т.п.

Формулируется общее расположение результатов поиска, определяется, какие метаданные будут показаны в качестве повтора или разъяснения запроса, нужно ли показывать общий вид документа, давать ли гиперссылки и к какому документу.

В коллекции, состоящей из документов различного формата (например Word или HTML), полезно указывать в результатах поиска возможные форматы выгрузки, чтобы пользователь смог сам определиться, что ему нужно. Указания по форматированию добавляются к вышеупомянутому документу по условиям просмотра.

 

Другие особенности Гринстон

Как уже отмечено, Гринстон – многоязычная система. В настоящее время созданы интерфейсы на следующих языках: арабский, китайский, чешский, голландский, французский, галисийский, немецкий, иврит, индонезийский, итальянский, японский, казахский, маори, португальский, русский, испанский, тайский, турецкий и английский.

Для того чтобы эффективно использовать это языковое богатство и для обеспечения подстройки соответствующего языка интерфейса при пополнении коллекции, все сетевые страницы до их демонстрации пропускаются через макрокоманду расширения языковой базы, опирающуюся на контрольную фразу. Это значит, что новый язык может быть добавлен путем включения нескольких типовых текстовых фрагментов. Этим способом легко может пользоваться человек, не очень искушенный в тонкостях программы Гринстон.

Инсталляция программы и формирование коллекции доступны человеку с весьма средними компьютерными способностями. Однако, обладая определенными навыками, можно сделать намного больше. При знании языка HTML вы сумеете включить утилиты Гринстона, например механизм полнотекстового поиска или просмотровые подпрограммы. Если вы владеете JavaScript, то удастся добавить механизм просмотра изображений, а при знании Perl можно существенно обновить процесс просмотра, например, добавив в него программу PinYin для работы с китайскими текстами.

Гринстон спроектирован на базе глубокой философии: простые вещи должны быть простыми, а сложные – доступными.

Некоторые более изощренные (продвинутые) возможности также можно включить в работу с фондом, добавив совсем немного в конфигурационный файл. Три примера:

  • можно создать для пользователя возможность в режиме, близком к режиму работы с печатными предметными рубриками или тезаурусами: программа может автоматически извлекать из полного текста фразы и строить иерархические отношения между ними;

  • точно так же можно автоматически извлекать из текста акронимы и их расшифровку;

  • язык каждого документа распознается автоматически и используется для создания индексов на каждом языке.

Как это обычно бывает при работе со столь высокоразвитой системой, как Гринстон, самые жесткие требования предъявляются к оформлению документов, входящих в состав фонда.

Естественно, что создатели фонда зачастую нуждаются в помощи и консультациях, чтобы подстроить программу под какие-либо вновь возникающие задачи. Существует дискуссионная группа, работающая в режиме электронной почты и оказывающая любую помощь участникам группы из 40 стран. Имеется обширная документация на английском, французском, испанском и русском языках.

Гринстон включена в типовой пакет документов ООН для обучения работе с информацией. ЮНЕСКО организует серию региональных программ переподготовки по использованию Гринстон.

  
На главную