Научные и технические библиотеки №4 2004 год
Содержание:

Десятая юбилейная Международная конференция «Крым–2003» – «Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества»

Секция 5. Библиотеки и музеи
в общем пространстве информации и культуры

Колганова А.А. Осуществленная реальность и ожидаемое будущее: библиотеки по искусству в общем библиотечном пространстве


Секция 6. Библиотечные кадры, профессия и образование

Столяров Ю.Н. О дисциплинах общепрофессионального и специального блоков в проекте учебного направления  «Библиотечно-информационная деятельность»

Земсков А.И. Методика преподавания курса «Электронные библиотеки»

Дрешер Ю.Н. Применение технологии активного обучения на кафедре информатики информационно-библиотечного факультета Казанского государственного университета культуры и искусств


Секция 12. Публичный доступ к правовой и деловой информации: проблемы и решения

Кучеров В.И. Программа информационной поддержки российских библиотек компании «Консультант Плюс»: итоги, проблемы, факты


Секция 14. Библиотековедение, библиографоведение и книговедение

Столяров Ю.Н. Библиотековедение, библиографоведение и книговедение. (Аналитический обзор докладов секции 14.)


Секция 17. Информационное и библиотечное обеспечение процессов образования и управления

Дригайло В.Г. Миссия вузовских и других научных библиотек

Бунь Е.В., Балацкий А.Н. Центральная библиотека образовательных ресурсов: цели, задачи, перспективы

Менцин Ю.Л. Программа АССИСТЕНТ: социальные аспекты развития науки и техники на сайтах ГПНТБ России

Еременко Т.В. Формирование информационной культуры современного университетского сообщества: опыт проектного развития


Семинар Секции ИФЛА «Информационные технологии» на Конференции «Крым–2003»

Линдквист М. Организационные и технологические аспекты записи научных данных


ИФЛА–2003

Кнутсен У. Электронные национальные библиографии: обзор современного состояния

Хакала Ю. Будущее электронных национальных библиографий

Пианос Т. Vascoda – портал научной информации, создаваемый немецкими библиотеками и информационными центрами


Франкфурт–2003

Земсков А.И., Евстигнеева Г.А. Россия – новые страницы


ОБЗОРЫ. РЕЦЕНЗИИ

Сукиасян Э.Р. Новая книга об информатизации вузовских библиотек

Каратыгина Т.Ф. Жизнь, отданная людям.
(Заметки о книге, посвященной С.А. Сбитневу)

Терешин В.И. Правовой фундамент деятельности российских библиотек


Семинар Секции ИФЛА «Информационные технологии»
на Конференции «Крым–2003»

Линдквист М.
директор библиотеки по экономике
Гетеборгского университета, Швеция

Организационные и технологические аспекты
записи научных данных

Доклад, представленный на Конференции «Крым–2003», переработан и дополнен автором специально для нашего сборника.

Эта статья о том, каким образом можно и нужно фиксировать научную информацию, как обеспечить ее сохранность для будущих поколений, что совершенно необходимо, поскольку развитие науки происходит аддитивным образом – новые данные добавляются на фундамент из уже имеющихся.

Условия для осуществления записи, распространения, использования и хранения научной информации (точно так же, как и любой другой информации) самым существенным образом изменились за несколько последних десятилетий вследствие бурного развития информационно-коммуникационных технологий (ИКТ).

К настоящему времени имеется множество аналитических исследований воздействия ИКТ на науку в целом, а также анализ тех проблем и открывающихся возможностей, которые приносит нам применение ИКТ.

Суть данной работы состоит в том, что накопленный опыт использования ИКТ и аккумулированное знание позволяют двигаться вперед и реализовать совершенно новый порядок записи научных данных. Но, к сожалению, этого не происходит, потому что в наших социальных, политических и экономических системах слишком сильна инерция, а наука, процесс исследования (как вид человеческой деятельности), конечно, неотделимы от упомянутых систем.


Причины для введения нового порядка

Развитие ИКТ предоставляет ученым возможность просто и недорого публиковать и распространять результаты своих исследований, не прибегая к помощи традиционных профессиональных издателей. Контроль качества публикаций (посредством реферирования) может осуществляться и во все большей мере осуществляется без участия традиционных издателей. Отличным примером такой технологии может служить создание системы архива препринтов по физике (эту систему иногда называют Лос-Аламосский архив); адрес архива http://arxiv.org/.

Другой важный стимул для разработки нового порядка – кризис рынка коммерческих научных издательств. С точки зрения извлечения прибыли кризис пока незаметен: огромная прибыль коммерческих издателей хорошо известна.

Офис честной торговли (Office of Fair Trade) Министерства труда и промышленности Великобритании распространил заявление, касающееся рынка научных, технических и медицинских публикаций. Два его основных заключения:

  1. Очевидно, что рынок научно-технических и медицинских публикаций работает неудовлетворительно.

  2. Уровень коммерческих цен на многие издания слишком высок, что наносит ущерб образовательным и научным учреждениям.

Офис не взял на себя смелость рекомендовать какое-либо вмешательство, оставив положение таким, какое оно есть, но отметил, что «необходим постоянный контроль за ситуацией».

Рыночный кризис состоит в том, что его коммерческие участники подрывают долговременную устойчивость традиционной системы научных коммуникаций и организации записи научных знаний.
Т. Бергстром (Ted Bergstrom) в статье «Бесплатный труд на благо дорогостоящих журналов» (Free Labor for Costly Journals. 2001) представил обоснование и аргументы для таких выводов; информативный и тщательный анализ процессов на рынке научно-технических и медицинских публикаций дал Ж.-К. Гвидон (Jean-Claude Guedon).


Основа альтернативных систем знания

Отсутствие проблемы авторского права

По отношению к новым научным статьям не существует проблемы авторского права, если ее не создавать силами самих ученых. Совсем необязательно передавать кому-то контроль над вашей работой, подписывая договор с передачей эксклюзивных прав на интеллектуальную собственность. При работе над договором можно вести переговоры, касающиеся условий передачи прав, оплаты и других моментов.

Вряд ли стоит ожидать от молодых ученых готовности вступать в борьбу против передачи эксклюзивных прав на интеллектуальную собственность – ведь молодежь на первых порах сильно заинтересована в публикациях в престижных журналах, поскольку начинающим ученым нужно заботиться о научной карьере. Однако же старшие и заслуженные коллеги должны в этом деле показать пример, быть лидерами.

Это один из основополагающих принципов нового порядка – следует сохранить контроль над научными публикациями в научном сообществе.


Необходимость новой инфраструктуры

Второй основополагающий принцип нового порядка состоит в установлении организационной инфраструктуры для сбора, обеспечения доступности, распространения и обеспечения сохранности записей научных данных. (Вряд ли нужно доказывать, что для библиотек, работающих с сотнями и тысячами наименований печатных журналов, традиционные технологии не имеют будущего.)

Создание Группы по открытым архивам (Open Archive Initiative, OAI, http://www.openarchives.org)  - это одна из многих попыток формирования инфраструктуры научных коммуникаций. Уже упоминавшийся г-н Гвидон считает, что OAI имеет блестящее будущее: «Ясно, что библиотекари должны использовать весь свой авторитет (а он, заметим, немалый) для поддержки OAI». Не повторяя здесь его аргументацию, скажу лишь, что поддерживаю это мнение.

Концепция Центра электронных публикаций зачастую используется для разработки технологий работы с электронными документами. Пока что продолжаются дискуссии о том, какой организационный принцип должен использоваться в работе с электронными документами; нужно ли руководствоваться предметной принадлежностью или институциональной? Если предметной, то могут ли профессиональные научные общества быть моделью предметной рубрикации? Или же лучше создавать кооперативные объединения научных работников, которые могут работать на междисциплинарной основе?

Научные организации по их ведомственной принадлежности зачастую группируют в три категории: промышленность, университеты и колледжи, другие некоммерческие учреждения. Доля исследований, проводимых в соответствующих группах, меняется от страны к стране. Чаще всего объемы научных исследований в промышленности во много раз превосходят две другие категории, но и здесь не столь явно выражено стремление публиковаться как можно чаще. В Швеции, например, именно университеты поставляют большую часть научных публикаций, и если посмотреть в БД Института научной информации (ISI) данные о шведских научных публикациях, то окажется, что около 90% авторов имеют непосредственное отношение к университетской среде.

Если предусматривать для Центра электронных публикаций институциональную модель, ориентированную на научные институты, то проявится разность в организационных моментах, зависящая от типа института.

В каждом случае нужно определить наиболее подходящий организационный уровень, обеспечивающий наивысшую эффективность Центра электронных публикаций. Для университетской структуры можно предположить, что разумнее всего иметь набор факультетских центров, причем организационные и технические вопросы, а также внешнюю кооперацию нужно проводить на общеуниверситетском уровне.

Наши рекомендации не связаны с каким-либо особо тщательным просмотром всех аргументов. Мы просто исходим из того, что университеты – наиболее стабильный тип учреждения из всех рассматриваемых. Научные отделы, без сомнения, слишком подвержены изменениям. Университеты вынуждены подчиняться указаниям начальства; наиболее выпукло принцип академической свободы реализуется именно на уровне факультета.


Организация электронных массивов научных знаний

Электронные документы вовсе не являются простой цифровой версией печатных документов, поэтому необходимо четко определить все компоненты научной электронной публикации, помня, что это часть записей о знаниях.

Международная научная группа, созданная по инициативе Ассоциации издателей научно-технической и медицинской литературы, изучала этот вопрос и выпустила соответствующий доклад. Один из его важнейших выводов – указание на необходимость составлять метаданные на электронный документ. Другие существенные моменты:

  • должен быть установлен контроль за появлением новых версий электронного документа;

  • следует ограничить возможность уничтожения документа и тщательно контролировать этот процесс;

  • целостность документа, его аутентичность и обеспечение долговременной сохранности, равно как и долговременного доступа, должны гарантироваться.

Невыполнение этих требований должно означать, что данную публикацию нельзя считать записью научных данных.

По мере того как научная публикация или доклад переходит от традиционного формата в Интернет-среду, наблюдается конвергенция типов документа. Например, отличить библиотечный материал от архивного становится нелегко – да это и ненужно. Поэтому традиционные методы определения местонахождения документа, основанные на библиографическом контроле, должны пополняться новыми.

К. Линч (Clifford Lynch) выделил три новых подхода, или метода. Первый состоит в изготовлении неких суррогатов библиографических записей и включении их в состав традиционных каталогов; при этом следует предусмотреть возможность включения и нетекстовых материалов, а также возможность совместного с другими информационными сообществами использования процедур или инфраструктуры.

Второй метод заключается в использовании компьютеризованной технологии работы с содержанием текстов. В качестве примера можно привести существующие системы автоматического индексирования и системы поиска по полному тексту, в том числе поисковые роботы (например Google).

Третий метод заключается в использовании общественного мнения, а именно оценок и действий со стороны тех, с кем автор работает, т.е. научной общественности Мы уже сейчас прислушиваемся либо так или иначе учитываем рекомендации наших коллег, мнения обозревателей, показания индексов цитирования. В электронной среде для развития такого рода подхода имеется самая благоприятная почва. С философской точки зрения такой подход означает, что публикация становится не плодом мыслей отдельной независимой личности, а неким общественным актом, частью социального контекста.

Обе основные идеи г-на Линча, касающиеся распределения элементов инфраструктуры между информационными сообществами и социального контекста работы, указывают на плодотворность объединения методов работы библиотек и методов архивной работы. Библиотеки привнесут в работу архивов предметный поиск и понятие основных точек доступа. Архивы же передадут библиотекам интерес к происхождению документа и технологию работы с набором разнородных документов. При увеличении количества документов не удается составить полноценную MARC-запись для всех элементов. А для электронных документов необходимо обеспечивать доступ к истории происхождения информации для того, чтобы правильно интерпретировать и использовать ее.

Итак, можно сказать, что два сообщества – библиотекарей и архивистов – обладают взаимодополняющим практическим опытом, чтобы адекватно реагировать на требования по определению местонахождения и обеспечению доступа к информации. Накоплен также весьма ценный опыт обработки записей, который поможет улучшить качество работы по определению технического происхождения документов.


Проблема гиперсвязей

«Больше не существует понятия одиночной статьи» – так назывался доклад Питера Бойса (Peter Boyce), представленный на семинаре «Отработка практических навыков и стандартов по электронным публикациям в науке», организованном в 1998 г. Американской ассоциацией по поддержке науки (AAAS), ЮНЕСКО и Международным советом научных обществ (ICSU).

«Одиночная журнальная статья без активных отсылок к другим электронным статьям или к ресурсам электронной информации скоро станет анахронизмом, – полагает П. Бойс. – Для эффективной исследовательской работы вы должны иметь прямой доступ ко всей релевантной информации». Далее он предсказывает: «Я предвижу, что система отсылок к библиографии, цитатам и цифровым объектам в кратчайшие сроки станет совершенно необходимой для каждого».

Это предсказанное будущее уже наступает. Обе новейшие системы – «Сеть науки» (Web of Science), усовершенствованная версия Системы указателей научного цитирования (Science Citation Index), а совсем недавно и Система перекрестных ссылок (Crossref, http://www.crossref.org) - могут быть примером.

Так в чем же проблема? В том, что все это находится в коммерческих руках, а не в руках научного сообщества. Значительная часть исторических научных данных была в свое время отлучена от научного сообщества из-за передачи издателям эксклюзивных прав на интеллектуальную собственность, и поэтому система гиперссылок не вполне общедоступна для научного сообщества, если ссылки даются на более старые материалы. Но по мере роста числа общедоступных сетевых публикаций эта проблема постепенно потеряет актуальность, и поиск известных позиций может успешно выполняться такими поисковыми машинами, как (Google). Но в настоящее время системой отсылок обладают коммерческие компании, владеющие копирайтом, и научное сообщество вынуждено оплачивать «налог на вход» к научным записям.


Долговременная сохранность

Проблема долговременной сохранности предполагает промежуток времени не менее 100 лет. Поэтому какие бы технологические стратегии ни обсуждались, они должны учитывать характерное время изменения программного обеспечения (а это всего лишь несколько лет) и более фундаментальные технологические изменения аппаратных платформ, которые имеют характерное время (десятилетия). Конечно, следует не забывать и об устаревании носителей информации.

Долговременная сохранность требует внесения соответствующих записей в метаданные и отслеживания в метаданных проведенных трансформаций. Следовательно, структура метаданных должна предусматривать АВС Онтологию и модель. Заметим для примера, что в базе данных Dspace Массачусетсского технологического института используется АВС в подсистеме «История документа».


Стратегии обеспечения сохранности

Можно перечислить три возможные стратегии обеспечения сохранности электронных документов по отношению к технологическим изменениям:

  1. Сохранять в целости всю устаревшую технику – этот подход можно назвать музейным.

  2. Эмулировать старое программное обеспечение в рамках нового.

  3. Проводить миграцию (конверсию) данных на новые системы.

Каждый из методов, по крайней мере теоретически, имеет свои достоинства. Но, на мой взгляд, на практике только третий метод оказался жизнеспособным.

В ранних исследованиях проблемы обеспечения сохранности электронных документов (Целевая группа по проблемам архивирования цифровой информации – Task group on archiving of digital information, 1996 г.) именно этот метод рекомендован для внедрения: «Имея в виду технологическое обновление, мы считаем, что миграция данных представляет собой полноценную и плодотворную концепцию, необходимую для защиты целостности записей культурного наследия».


Другие проблемы копирайт и проблема шифровки

Во многих странах законодательство запрещает делать электронные копии документа без ясно выраженного согласия владельца авторских прав. В этом содержится определенный риск, поскольку миграция автоматически означает снятие электронных копий. Точно так же, как и с проблемой гиперсвязей, о которой говорилось ранее, данная проблема (создание страховых копий в целях обеспечения сохранности) будет исчезать по мере накопления массива общедоступных научных материалов.

Определенную угрозу для развития технологии сохранности таит в себе современная тенденция шифрования информации. Сегодня шифровке подвергаются в основном материалы, предназначенные для развлечения или имеющие промышленное назначение; но поскольку зона интересов науки постоянно расширяется, то шифровка может оказаться негативным фактором в процессе обеспечения сохранности.

Некая позитивная сторона проблемы заключается в том, что по мере старения научных материалов их коммерческая ценность уменьшается, так что значительные объемы такой информации распространяются в аггрегированном виде (пакетами) по сравнительно невысоким ценам, для примера назову базу данных JSTOR (http://www.jstor.org).


Технология и стандарты

Регламент статьи не дает возможность сделать что-либо, превосходящее только краткий обзор технических стандартов, имеющих отношение к разработке нового порядка создания научных записей.

Я уже упоминал Группу по открытым архивам (OAI), которая разработала протокол поиска ресурсов и распространения документов. Для долговременной сохранности широко используется Справочная модель открытых информационных систем (Reference Model for an Open Archival System, OASIS, http://www.ccsds.org/documents/650´0bl.pdf); эта модель сейчас принимается в качестве стандарта ISO (присвоенный номер 14721:2002).

Набор метаданных Даблин Кор (http://www.dublincore.org) уже занимает позиции, близкие к тому, чтобы стать стандартом описания электронных документов, хотя разработки этой схемы продолжаются и по сей день.

Альтернативные модели описания ресурсов – это основанные на языке разметки XML схемы MARC.

Выбор между этими схемами – скорее вопрос амбиций (которые, как правило, коррелируют с объемом бюджета). С точки зрения стандартизации XML имеет то преимущество, что он основан на языке SGML (http://www.w3.org/MarkUp/SGML/), который, возможно, все еще является наиболее безопасным выбором для структурирования документа.

Для представления буквенных символов единственной схемой, имеющей долгосрочный потенциал развития, является Unicode, ставший официальным международным стандартом ISO/IEC 10646 (http://www.unicode.org).

Для передачи данных специалисты широко используют стандарт кодировки и передачи (Metadata Encoding and Transmission Standard, METS; http://www.loc.gov/standards/mets/).

В базе данных Dspace Массачусетсского технологического института вы найдете примеры использования многих из упомянутых стандартов. Эта БД организационно имеет институциональный уровень (по терминологии данной статьи – уровень университета). Развивается модель сотрудничества отделов института. Dspace структурирована на основе Справочной модели открытых информационных систем (OASIS), поддерживает протокол OAI, совместима со стандартом METS и языком разметки XML.

Все это свидетельствует о наличии соответствующей технической базы отработанных стандартов, достаточной для того, чтобы научное сообщество могло осуществлять коммуникации и обмен документами.


Сеть сертифицированных хранителей

В 1996 г. Группа по изучению проблем архивирования цифровой информации рекомендовала следующую инфраструктуру для обеспечения сохранности: «Критической компонентой инфраструктуры обеспечения сохранности цифровых документов является наличие достаточного количества доверенных организаций, способных осуществлять хранение, миграцию и обеспечение доступа к цифровым коллекциям. Необходимо введение процедуры сертификации учреждений, готовых служить цифровыми архивами с тем, чтобы сформировать атмосферу всеобщего доверия относительно перспектив сохранности цифровой информации».

Эти рекомендации до сих пор актуальны.

Объединение научных библиотек (RLG) продолжает работу по теме «Доверенные цифровые репозитарии» и составило спецификацию необходимых функций и ответственности для понятия доверенный цифровой репозитарий.

Итак, можно считать, что основы заложены. Необходимы действия на международном уровне для незамедлительной реализации рекомендаций.


Заключение

Информационно-коммуникационные технологии создали массу благоприятных возможностей для более эффективной работы научного сообщества и обеспечения сохранности научных данных. В свою очередь научное сообщество, в том числе специализированные учреждения по обеспечению сохранности знаний, должны реформировать систему производства, распространения и хранения научной информации. Офис честной торговли Великобритании считает, что это ключевой вопрос развития рынка, но пока «слишком рано давать оценки того, каким будет воздействие этого соединения усилий информационно-коммуникационных технологий и научной мощи».

Все необходимые предпосылки для установления нового порядка в научных публикациях уже созданы. Настало время самому научному сообществу попробовать свои силы в деле наведения порядка с результатами собственной работы.

  
На главную