УДК 025:65.011.56

Вербицкая Т. В., Фефелова Н. В.

Опыт использования «ИРБИС64 – Полнотекстовые БД» при формировании полнотекстовых баз данных
краевых дореволюционных газет в Государственной
универсальной научной библиотеке Красноярского края

Государственная универсальная научная библиотека Красноярского края – старейший региональный краеведческий информационный центр – обладает богатейшим книгохранилищем в Сибири, в котором достойное место занимает красноярская дореволюционная периодика, представленная в фондах с первой газеты «Енисейские губернские ведомости» (1857 г.) до полного комплекта ведущей краевой газеты «Красноярский рабочий» (1905 г.). Всего в фонде 39 названий региональных дореволюционных газет, выходивших в разное время в Енисейской губернии XIX – начала XX вв.

Дореволюционная газета – важнейший источник информации о крае, поэтому спрос на газетные документы того периода не ослабевает, а напротив, значительно увеличивается. В русле политики объединения территорий Красноярского края, внедрения национально-регионального компонента в образовательных учреждениях края резко возросла потребность в информации, связанной с историей нашего края.

Приенисейский край и сибирский регион в целом – продукт взаимодействия различных цивилизаций во временном и пространственном измерениях. Определяющими чертами взаимодействия являются: полиэтничность, поликонфессиональность, способность к диалогу культур, веротерпимость, толерантность, открытость культуры, способность к культурной адаптации и т.д.

Для ликвидации лакун, открытости информации велика ценность дореволюционных красноярских газет, которые порой являются единственным источником, передающим объективную информацию, помогающим осмыслить события и явления на пересечении локальных сибирских, российских и глобальных тенденций, в контексте отечественной и мировой истории и культуры, дающим возможность ясно представить различие и сходство процессов, общность судеб края и России в целом.

Газетный дореволюционный фонд ветхий, требует кардинальных мер по сохранности. В настоящее время пользование им регламентировано. Библиотека использует все возможности по его сохранности.

Очень своевременно Российская государственная библиотека начала работу по микрофильмированию региональных газет, с ее помощью мы получили комплект микрофильмов газеты «Енисейские губернские ведомости», и теперь пользователи имеют возможность полноценно работать с единственным историческим источником.

Библиотека, при всех сложностях с бюджетным финансированием, ищет пути выхода из кризисной ситуации. На протяжении ряда лет разрабатывает и воплощает в жизнь проекты по сохранности фонда. В первую очередь переводятся на электронные носители газеты, пользующиеся устойчивым массовым спросом, содержащие ценный краеведческий материал. Для этого используются различные методы – микрофильмирование, фотографирование, сканирование. Прежде всего решается задача сохранения оригинала, а также выявления недостающих экземпляров и восполнения фондов музеев и архивов.

Наряду с решением задачи сохранности фондов библиотека действует как открытая система, обменивающаяся информацией с другими учреждениями и организациями. Изменение информационных потребностей пользователей, внедрение автоматизированных технологий кардинально меняют политику, направления и возможности библиотечного обслуживания. Библиотека стремится развить информационную культуру пользователей, ориентировать их на самостоятельный поиск информации; не менее важным является формирование проектно-ориентированного мышления, которое заключается в умении выстроить стратегию осмысленного видения исторических событий и закономерностей. Библиотека стремится открыть информационные возможности для широкой читательской аудитории, поддержать и развить дистанционное обучение, обеспечить удаленный доступ к информации.

В 2005 г. библиотека приступила к осуществлению проекта по созданию полнотекстовой БД документальных материалов собственной генерации на основе дореволюционных краевых периодических изданий. Это стало возможным благодаря подсистеме ИРБИС64 для создания полнотекстовых БД, которая позволяет выстроить параметры исполнения проекта по оцифровке газетного материала, дающие возможность легко и быстро ответить на любой запрос пользователя.

Этой работой занимаются отдел краеведческой информации и отдел новых информационных технологий. Разработана технологическая карта взаимодействия специалистов отделов.

Создание полнотекстовой БД начали с ранее переведенной в электронный вариант газеты «Енисейская мысль» (1912–1915 гг.) в формате JPEG.

 

В связи с тем, что мы имеем дело с дореволюционной периодикой, выпущенной до реформы правописания 1918 г., простое распознавание текста газет не подходит для организации поиска по запросу. Принято решение не преобразовывать данные, имеющиеся в формате JPEG, но разработать HTML-документ, где ключевые слова сохраняются в HTML-формате, а образ отдельной страницы, который также доступен пользователю, – в формате JPEG.

Отделом краеведения в процессе библиографической подготовки были определены ключевые слова из текста, а также подобраны синонимы, адаптированные к современному языку (например: портомойня – прачечная).

Так, № 21 от 5 дек. 1912 г. газеты «Енисейская мысль» в результате поиска представлен пользователю в виде набора ключевых слов и образа страницы (рисунок).

Пользователь имеет возможность работать с цифровой копией источника.

Преимущества полнотекстовой БД:

· ключевые слова расположены в алфавите;

· не надо просматривать массив газет номер за номером;

· информация по заданному вопросу выходит комплексно, без пробелов;

· БД может пользоваться неквалифицированный пользователь;

· удобство пользования цифровыми копиями;

· для долговременного хранения электронную копию несложно перенести на микропленку;

· быстрое копирование статьи.

Недостатки:

· при поиске выходит вся газетная страница без маркирования статьи;

· не выделены поисковые слова.

 

Дальнейшие планы: оцифровать микрофильмы газеты «Енисейские губернские ведомости», по договоренности с издательским домом «Новый Енисей» перевести дореволюционную газету «Енисей» на электронные носители.