Home page | Каталоги и базы данных

Научные и технические библиотеки

Ильина В.В.
Центр "Образование" Российской
государственной юношеской
библиотеки, Москва


Электронные публикации из фактографических баз
данных по вопросам обучения в России и зарубежных
странах: результаты эмпирического исследования и опыт
применения лингвистических разработок в
гипертекстовых публикациях

С 1994 г. в Российской государственной юношеской библиотеке (РГЮБ) формируется библиотечная информационная система "Инновационное образование". Это совокупность документно-фактографических баз данных по вопросам обучения в России и зарубежных странах, включающая три БД: "Инновации в среднем образовании", "Высшее образование в России сегодня", "Образование за рубежом".

В качестве базовой СУБД для разработки программного обеспечения БД выбрана Microsoft Access 2.0. Возможности системы позволяют получить информацию не только адресно-реквизитного характера, но и подробные сведения об учебных программах, литературе, рекомендуемой к конкретному предмету, библиографическую информацию.

Программное обеспечение для ведения БД разрабатывалось с учетом современных требований к пользовательским интерфейсам, совместимости форматов электронных каталогов и баз данных российских библиотек; принимались во внимание и возможности совместного использования БД и компьютерных редакционно-издательских систем.

Разработчики информационной системы "Инновационное образование" (сотрудники РГЮБ и АО "Контекст") создали сетевую версию этой программы, положив в основу принцип коллективного наполнения БД, рассматривая их как корпоративный информационный продукт, создаваемый в различных регионах страны и объединенный в Москве в единую базу данных, доступ к которой будет возможен по модему из любого региона России.

Профинансированный Министерством культуры РФ проект "Библиотека и инновационное образование" позволил создать оболочку информационной системы. Сегодня это уже готовый зарегистрированный информационный продукт, он активно эксплуатируется несколькими библиотеками России. Справочной системой пользуются абитуриенты Москвы, которые могут получить здесь подробные сведения о 200 московских вузах, о зарубежных учебных заведениях.

С использованием оболочки информационной системы "Инновационное образование", разработанной в РГЮБ, в 1996 г. в Кемеровской областной юношеской библиотеке создана информационная система "Учебные заведения г. Кемерово и Кемеровской области", подобная система создается и в Новосибирской области.

В ходе эксплуатации информационной системы выяснилось, что функции ввода и хранения информации в СУБД удобны и надежны, а система поиска и вывода информации требует новой разработки с применением интуитивных средств доступа к данным. Наилучшим и наиболее экономичным, с нашей точки зрения, средством доступа к информации является гипертекстовая организация данных.

К основным элементам гипертекстовой технологии относятся структура гипертекста и списки ключевых слов. Выбирая нужные элементы структуры и пользуясь ключевыми словами, пользователь может с их помощью искать нужную ему информацию в базе данных. Структура гипертекста и состав ключевых слов определяется структурой и лексикой текстов, представляющих информацию в базы данных. Учет структуры и лексики запросов потенциальных пользователей сделает систему более удобной для пользователей, но для этого необходимо знать структуру и лексику пользовательских запросов.

Для получения таких знаний под руководством С.В. Чеснокова, канд. физ-мат. наук, директора Института физики Логоса сотрудниками РГЮБ, ГНПБ им. К.Д. Ушинского и АО "Контекст" проведено исследование структуры и лексики запросов пользователей.

Чтобы узнать о структуре и лексике пользовательских запросов, с которыми придется столкнуться при практической эксплуатации баз данных, было решено ограничиться двумя типами лексического материала. Первый представляет нормативную терминологию и структуру знаний, которые характерны для профессиональной среды специалистов - исследователей, педагогов - тех, кто занимается управлением в системе образования. Второй представляет запросы, с которыми обращается к базам данных массовый пользователь.

В результате получены: методики исследования специализированной лексики профессионалов и живой ситуативной лексики массового пользователя; массивы "специализированной" и "живой" лексики; материалы по "специализированной" и "живой" лексике, по которым составлены словники; методика использования результатов проведенной работы для формирования гипертекстовых структур и списков ключевых слов в гипертекстовых базах данных по образованию в России и за рубежом.

В основу методики исследования структуры и состава специализированной лексики (авторы Г.П. Плотникова и Т.С. Маркарова) положена техника составления тезаурусов по проблемам образования. В качестве исходного материала использован следующий набор источников специализированной лексики: электронная версия Тезауруса по педагогике и народному образованию ГНПБ им. К.Д. Ушинского (версия 1994 г.); тезаурус ЮНЕСКО-МБП по образованию (версия 1991 г.); предметные рубрики таблиц ББК по разделам "74 Народное образование. Педагогические науки" и "88 Психология" (версия ГНПБ им. К.Д. Ушинского); большой массив отечественных и зарубежных информационных документов.

При отборе лексических единиц учтены объекты баз данных РГЮБ: "Высшее образование в России", "Инновации в среднем образовании", "Образование за рубежом".

В результате подготовлен Словник специализированной лексики, включающий примерно 2 тыс. слов и словосочетаний на русском языке. Он отражает структуру знаний о системе образования и состав лексических единиц, используемых для обозначения элементов этой системы. Словник может применяться для индексирования и поиска документов из области образования. В контексте данной работы словник предназначен для формирования и коррекции структуры гипертекста и списков ключевых слов при организации системы пользовательского доступа к базам данных.

Для получения массива живой лексики, характеризующей массового пользователя, проведено социолингвистическое обследование посетителей библиотеки, которые откликнулись на объявление (вывешенное у входа в библиотеку в течение одной недели) о возможности получить информацию. Объектом исследования в нашем случае были не индивиды (в обследовании участвовали 105 человек), а ситуативные лексические единицы, которые используются читателями при формировании вопросов к базам данных; их количество (661) мы считаем достаточно представительным. Гипотеза о том, что вариативность состава обследуемых лексических единиц в языке значительно меньше, чем вариативность житейских ситуаций, исходя из которых формируются запросы к базам данных, в процессе последующей эксплуатации гипертекстовой системы полностью подтвердилась.

Цель данной работы - не статистическая оценка частот встречаемости тех или иных классов лексических единиц, а обнаружение самих классов. Проведенное исследование можно отнести к типу "изучение ключевых ситуаций". Полученные знания дали возможность учесть особенности пользовательской лексики в гипертекстовой системе пользовательского доступа к базам данных.

Для создания системы доступа к базам данных на основе гипертекстовой технологии по результатам исследования:

  • выделен стандартный перечень фрагментов баз данных по образованию, которые решено "опубликовать" в виде гипертекста;
  • на основе корпуса ситуативных лексических единиц подготовлены разные варианты структур, описывающих выделенные фрагменты;
  • разработаны разные варианты списков ключевых слов для гипертекстового представления фрагментов баз данных;
  • выявлены связи подготовленных вариантов структур со структурами гипертекстов, представляющих выбранные фрагменты баз данных (построены логико-семантические связи пользовательской лексики с содержанием баз данных).

Эта семантическая сеть положена в основу действующей системы гипертекстового доступа к БД по зарубежному образованию. Построены первые экраны и определена оптимальная структура входа в гипертекст, учитывающая особенности профессиональной лексики специалистов по системе образования и живой лексики массового пользователя. Итогом работы стала также технология создания гипертекстовых публикаций, применимая для публикаций из других баз данных.

Для создания гипертекста как в России, так и за рубежом разработано большое количество инструментального программного обеспечения. В своей работе мы сочли целесообразным использовать инструментальные средства для создания стандартных гипертекстовых справочных систем (систем онлайновой помощи) операционной системы Windows (Windows Help).

Преимущества такого подхода:

  • пользователю не требуется осваивать какой-либо новый, не знакомый ему интерфейс, так как справочной системой умеет пользоваться каждый, кто хоть раз работал в операционной среде Windows;
  • инструментальные средства справочной системы Windows позволяют использовать весь арсенал современных выразительных средств - шрифты, цвета, графику и т. д.;
  • в справочной системе Windows имеется большой набор средств организации гипертекстовых связей, навигации, индексирования и поиска;
  • пользователю не требуется покупать какое-либо дополнительное программное обеспечение, так как справочная система Windows встроена в операционную систему;
  • справочная система Windows хорошо документирована.

Эксплуатация гипертекстовой публикации в течение года в РГЮБ подтвердила целесообразность выполненной работы. Гипертекстовая публикация оказалась более оперативной и эффективной, чем бумажная, так как может распространяться на дискетах, по электронной почте и в режиме онлайн по сетям.

Copyright © 1995-97 ГПНТБ России