Home page | Каталоги и базы данных

Научные и технические библиотеки


УДК 02(73)+025:65.011.56

Хи Гвон Ю

«Визуальные сокровища» –
проект Нью-Йоркской публичной библиотеки.
Оцифровка русских визуальных ресурсов

От редакции. Этот доклад был представлен на ежегодном российско-американском семинаре «Электронные ресурсы и электронные библиотеки: современное состояние и перспективы», организованном Международным библиотечным, информационным и аналитическим центром и ГПНТБ России в Вашингтоне 12—13 марта 2001 г.
Надеемся, что нашим читателям, во-первых, приятно будет узнать о заботливом отношении к нашей истории и, во-вторых, пригодится организационный и технологический опыт, накопленный одной из богатейших библиотек мира, о чем обстоятельно рассказал молодой и очень аккуратный корейский исследователь российских фондов одной из крупнейших американских библиотек.

 В январе 2000 г. Нью-Йоркская публичная библиотека приступила к реализации проекта «Визуальные сокровища». Он рассчитан на 5 лет: за это время предполагается оцифровать более 600 тыс. изображений, отобранных из различных собраний редких документов, в том числе из коллекции восточных и славянских документов: фотографии, исторические карты, артефакты из истории города Нью-Йорка, аудио-материалы, фильмы и видео. Проект направлен в первую очередь на перевод в машиночитаемую форму не текстов, а изображений, имеющих большое научное значение и пользующихся повышенным спросом.

В течение первого года проведена сборка фотокамер, сканеров, подбор персонала для программы «Цифровая библиотека». Подготовлены метаданные, содержащие общую информацию об изображениях – альбомах фотодокументов, иллюстрированных изданиях, исторических картах.

Метаданные готовились на двух уровнях: общая каталогизационная информация на уровне объекта в целом (object level) и специфическая информация, описывающая каждое отдельное изображение (sub-object level). Используя самое разнообразное оборудование, группа цифровых изображений проводила сканирование изображений совместно с метаданными, а группа сетевой подготовки осуществляла перевод массивов в формат оптических дисков.


Коллекции восточных и славянских документов

С самого начала проект использовал материалы из отдела восточных и славянских документов Нью-Йоркской публичной библиотеки, который существует уже более 100 лет и хранит замечательные фонды – оригинальные русские и восточно-европейские фотографии XIX в., полноформатные (in folio) иллюстрированные издания, русские, афиши, плакаты, почтовые открытки XX в.

На первом этапе оцифрованы более 4 тыс. фотографий, сделанных в России и Восточной Европе середины XIX – начала XX в. Это фотографии церквей, предметов церковной утвари, виды провинциальных городов и памятников архитектуры и др.

Вторая фаза проекта предполагает оцифровку более 10 тыс. иллюстрированных изданий. Их содержание намного разнообразнее: образцы декоративного искусства, фарфор, ткани, промышленные изделия, географические исследования регионов Российской империи, сатирические журналы, портреты, геральдические материалы, образцы военной формы и многое другое.


Метаданные

Проект «Визуальные сокровища» предполагает несколько этапов отбора и сопоставления описаний метаданных на материалы. Прежде всего кураторы из каждого отдела библиотеки, привлеченного к работе над проектом, готовят рекомендации по материалам конкретных фондов с учетом общих критериев отбора, принятых в проекте. Эти рекомендации изучаются персоналом программы «Цифровая библиотека» с учетом технологических возможностей. Затем группа подготовки метаданных заполняет лист анализа фондов (ЛАФ) на каждую одобренную и принятую к конверсии коллекцию. И наконец, наблюдательный совет «Цифровой библиотеки» принимает список проектов. После этого списки передаются в группу метаданных для генерирования описаний, а затем в «Цифровую библиотеку» — для сканирования.

Концепция метаданных восходит к началу 1990-х гг., а сейчас обретает все более важную роль. Метаданные – это информация об информации; они совершенно необходимы для идентификации, поиска и нахождения сетевых ресурсов. Через метаданные пользователь сети находит список необходимых ему материалов, а затем и сами материалы. В случае оцифровки визуальных ресурсов метаданные помогут пользователю найти их в сети. Именно поэтому столь важным является обеспечение точности и аккуратности метазаписей.

Как мы уже упоминали, генерация метазаписей славянских материалов ведется на двух уровнях – уровне объекта (документа) и уровне субобъекта (составной элемент документа). На первом отражается описание документа в целом, например фотоальбома; на втором – описания отдельных фотографий, входящих в альбом, причем возможности поиска на этом уровне полностью сохраняются, в том числе по добавочному заголовку и ключевым словам, относящимся к субобъекту. Ясно, что наиболее важные элементы метазаписи находятся на уровне объекта. Например, библиографическое описание альбома «Виды Петербурга», содержащего 71 фотографию с видами города, дает общую информацию об альбоме и обеспечивает исходную точку поиска.

Запись на уровне субобъекта содержит минимальные данные по каждому изображению. К большинству визуальных материалов имеются подписи на русском языке и их нужно переводить на английский. В одних документах даются краткие подписи под рисунками, в других – длинные пояснения (при составлении библиографической записи их нужно сокращать). Например, Дмитрий Александрович Ровинский (1824 — 1895) в своей работе «Материалы для русской иконографии…» дал детальные описания под каждой иллюстрацией. Конечно, группа метаданных сокращает их, оставляя лишь самое существенное, затем переводит на английский язык и заносит в описание.

Как быть в том случае, когда подпись под рисунком отсутствует? Мы проводим консультации с экспертами по русскому искусству и архитектуре в библиотеке и за ее стенами. Например, подготовка к оцифровке и составлению метаданных для альбома Далматова по текстилю (Константин Дмитриевич Далматов, «Образцы старинного узорного шитья и кружев из коллекции К. Далматова», С.-Петербург, 1893) потребовала помощи коллег из отдела славянских и балтийских фондов. Все изображения в этом альбоме относятся к образцам вышивки и способам изготовления, принятым в российских столицах и провинции. Иногда требуются консультации коллег из России и Восточной Европы и обмен электронными изображениями для того, чтобы облегчить процесс идентификации.

Существенно важен и доступ к крупным фондам справочных материалов. В отделе славянских и балтийских фондов более 13 тыс. томов литературы, которая может оказаться полезной в идентификации и составлении описаний изобразительных материалов, не имеющих подписи. При генерации метаданных столь же необходим поиск в авторитетных файлах крупнейших онлайновых баз данных RLIN или OCLC. Сверка с этими источниками позволяет убедиться в том, что пользователь обращается к стандартизованным поисковым терминам, например «Нижний Новгород», а не «Горький» или «Низкий Новгород», а при поиске по имени места «Красная площадь» нужно пользоваться термином «Red Square», уже устоявшемся в кругах англоговорящих научных работников.


Проблемы консервации

Материалы, отобранные для оцифровки, должны быть в хорошем состоянии. В соответствии с правилами и критериями, разработанными коллективом программы «Цифровая библиотека», визуальные материалы должны быть ясными и четкими, не иметь поверхностных дефектов. Листы альбомов должны допускать возможность работы с ними без заламывания или сгиба. Таким образом, в процессе оцифровки визуальных материалов возникает некая внутренняя проблема: нужно ли проводить оцифровку и тем самым как-то «беспокоить» документы или не трогать их сейчас и допустить процесс старения при традиционном библиотечном использовании оригиналов.

В отделе славянских и балтийских фондов с 1898 г. зарегистрированы более 2 млн пользователей. Кондиционирование воздуха началось только в середине 1980-х гг. Некоторые фотоальбомы и иллюстрированные издания стали очень хрупкими и нестойкими из-за того, что были напечатаны на кислотной бумаге либо находились в контакте с кислотной бумагой. Некоторые фотографии пожелтели или посерели.

Акцент на высокую производительность процесса оцифровки не позволяет коллективу программы «Цифровая библиотека» расходовать дополнительное время на особо деликатное обращение с очень хрупкими или нестойкими материалами, т.е. они не будут обрабатываться. Такие библиотеки, как Нью-Йоркская публичная, должны стремиться к тому, чтобы проекты оцифровки рассматривались в более общем аспекте обеспечения сохранности коллекций.

Перевод в машиночитаемую форму – это мощнейший инструмент, позволяющий снизить нагрузку на материал (редкие книги, фотографии) при обслуживании за счет предоставления читателям электронных копий документов. Поэтому вместо отказа от оцифровки документа по причине его хрупкости или непрочности нужно бы принять технологию «оцифровка в целях сохранности» – до того, как произойдет непоправимое ухудшение состояния материала.

Коллекция оригинальных фотографий и иллюстрированных изданий из фондов Нью-Йоркской публичной библиотеки, в настоящее время проходящая процесс оцифровки, является необычайно ценным источником информации для ученых и читателей. После оцифровки визуальные материалы будут общедоступны через Интернет.

Таким образом, реализация проекта «Визуальные сокровища» окажет положительное влияние как на использование и доступность коллекции для пользователей со всего мира, так и на обеспечение сохранности этих драгоценных оригинальных материалов.


Copyright © 1995-2001 ГПНТБ России