Home page | Каталоги и базы данных

Научные и технические библиотеки


 

УДК 025.43

Маркарова Т.С.

Отраслевой тезаурус в информационно-поисковой системе

В связи с внедрением новых информационных технологий и созданием локальных электронных баз (каталогов) встает вопрос о выборе средств лингвистического обеспечения автоматизированных библиотечных систем. В Государственной научной педагогической библиотеке (ГНПБ) им. К.Д. Ушинского одним из таких средств стал отраслевой педагогический тезаурус. С 1993 г. лингвистическая группа ГНПБ осуществляет работу по адаптации и ведению Тезауруса ЮНЕСКО [1], который отобран из ряда немногих существующих педагогических тезаурусов как самый репрезентативный.

Выбор Тезауруса как основного репрезентатора международной педагогической терминологии обусловлен несколькими причинами: тенденцией к лексикографическому представлению научных знаний, актуальностью использования тезаурусов в практике информационных процессов и социальных коммуникаций, необходимостью осознания связи структуры информационных систем со структурой самой науки, ее языка.

С точки зрения лингвистики интересен вопрос о близости и соотношении тезаурусов с традиционными терминологическими словарями, являющимися по сути своей толковыми. В традиционных толковых словарях термины выполняют лишь так называемую лексическую функцию, общую для всей лексической системы языка в целом; а в тезаурусах термины имеют свой набор связей, заданную степень глубины (детальности) описания, которая определяется уровнем метаязыка, использованного для описания словарных единиц, а именно набором связей функций и самим лексическим составом тезауруса.

В данной статье рассмотрен отраслевой тезаурус, вбирающий в себя понятийно-терминологический аппарат такой интегрированной области человеческого знания, как педагогическая наука.

Базовыми единицами тезауруса являются термины, когда речь идет о тезаурусе как о таковом, и дескрипторы, когда речь идет об информационно-поисковом тезаурусе. “Дескриптор – это слово (термин), которое выбирается из ряда синонимических терминов в качестве представителя этого ряда (предмета информационно-поискового запроса) в информационно-поисковых системах (информационно-поисковых тезаурусах). Перечень дескрипторов формирует поисковый образ документа” [2].

Некоторая многозначность и широкая синонимия термина-дескриптора, несмотря на внешнее противоречие с традиционной терминологией, только обогащает современную терминосистему, которая в свою очередь отражает интеграцию и взаимопроникновение различных областей знания и отраслей науки. Вот эта проблема интертеоретических (международных, междисциплинарных) отношений и заставляет обратиться к вопросу о синонимии в научной терминологии. В естественном языке синонимия является реализацией семантической гибкости языка. В том осознанном процессе, которым является создание терминологии, синонимии, казалось бы, не должно быть. Однако явления сходства по значению при различии в форме и совпадения в форме при различии в значениях существуют в любой реально существующей терминологии. При этом нужно различать внутриязыковую синонимию и частично эквивалентную лексику разных научных языков. Первая существует в пределах одного теоретического единства, когда на базе общих концептуальных представлений создается научный “обиход”, где одно и то же понятие либо может быть выражено средствами разных естественных языков (тьюторство – наставничество), либо наряду с общепринятой имеет номинацию, возникшую в индивидуальном языке ученого (педагогика высшего образования – педагогика высшей школы, дефектология – педагогика специальная). Наиболее полно диалектические связи между языковыми знаками и реалиями экстралингвистической действительности раскрываются с помощью полевой модели системы языка. Поле в лингвистике становится одной из важнейших категорий, в которой системно и синтетически рассматриваются однородные по своему содержанию единицы; при этом описывается не только сам язык, но и система соответствующих понятий (иногда главным образом она). Поле задается определенным смысловым содержанием, доминантой поля. В нем выделяется ядро (лексема-понятие или группа лексем-понятий), центр (классы основных понятий, реалем с их синонимическими, антонимическими и другими отношениями) и периферия (система смежных реалий, смежных полей – слов – понятий вторичной семантической функции).

Представляя собой определенную семантическую структуру, поле отражает иерархию ее основных классов слов (реалем) и соотносительных языковых средств. Такая структура может быть описана с помощью родовидовых отношений, отражающих предметно-понятийную классификацию элементов.

Современная интерпретация семантического поля опирается на синтагматические и парадигматические свойства единиц поля. Поэтому целесообразно, особенно учитывая коммуникативный характер языка, говорить о парадигматическом и синтагматическом измерении, где существенно не только положение слова-понятия в парадигме, но и его синтагматические (сочетаемостные) свойства. Такая сложная система систем, как язык, может функционировать только на основе внутренней согласованности и синхронизации ее элементов.

Полевая модель языка легла в основу структуры информационно-поискового тезауруса по педагогике (Тезаурус ЮНЕСКО-МБП по образованию). Дескрипторы в тезаурусе размещены в восьми широких группах, определяемых как поля и охватывающих наиболее широкую область педагогики и образования и смежных с ними отраслей науки и техники. Предметно-понятийные поля педагогического тезауруса описывают:

  • социально-политический и общественный строй, в рамках которого осуществляется педагогический процесс (Поле 1. Контекст. Сюда входят такие дескрипторы, как политика, демография, наука, семья и т.п.);

  • область исследования и принципы управления образованием (Поле 2. Управление и исследования. Сюда входят такие дескрипторы, как планирование образования, управление кадрами, руководство школой, стандарты и т.п.);

  • организацию процесса обучения (Поле 3. Обучение. Сюда входят такие дескрипторы, как программы обучения, учебный план, программированное обучение, учебно-воспитательная среда и т.п.);

  • объекты образовательного процесса – людей (Поле 4. Люди. Сюда входят такие дескрипторы, как учащиеся, учителя, консультанты, религиозные группы и т.п.);

  • развитие и учение с психологической и физиологической точек зрения (Поле 5. Развитие и учение. Сюда входят такие дескрипторы, как мыслительные процессы, эмоции, пол, физиология и т.п.);

  • учебно-предметное содержание процесса обучения и воспитания (Поле 6. Содержание. Сюда входят такие дескрипторы, как биологические науки, высшее образование, педагогическое образование и т.п.);

  • материальную базу процесса обучения и воспитания (Поле 7. Вещи. Сюда входят такие дескрипторы, как ресурсы, школьные мастерские, ЭВМ, наглядные материалы и т.п.);

  • пространственно-временные рамки и этнические характеристики образовательного процесса (Поле 8. Место. Время. Пространство. Сюда входят такие дескрипторы, как континенты, Океания, русские, хронологические рамки и т.п.).

Учитывая образовательное значение педагогической информации, в процессе пополнения тезауруса новыми терминами целесообразно руководствоваться такими лингвистическими принципами, как:

  • устойчивость языковой нормы, консерватизм языкового материала;

  • распространенность языкового материала как принцип нормы;

  • авторитет отраслевого и лингвистического источника как признак нормы;

  • принцип функциональной и коммуникативной целесообразности;

  • взаимообусловленность грамматических, лексических и семантических факторов;

  • взаимосвязь парадигматических отношений и ассоциативных связей как основы построения фасетов и полей тезауруса;

  • сочетаемостные возможности (валентность) дескрипторов (терминов).

Лексическая наполненность и семантический потенциал логико-понятийных полей информационно-поискового тезауруса по педагогике, на мой взгляд, позволяют ему не только функционировать в качестве информационно-поискового языка, но и в равной мере представлять достаточно интегрированную и постоянно обновляющуюся педагогическую терминологию. Система отслеживания и распространения современной мировой педагогической терминологии позволяет достичь согласованности отечественной научной педагогической терминологии с наиболее распространенной в мире терминологической системой. (Под системой терминов подразумевается сложная система семантических отношений между ними.)

В рамках языка науки на первый план выдвигается не номинативность термина-имени, а функция выражения (репрезентации) целостного научного понятия, чей суммарный семантико-логический, понятийный объем значительно превышает объем семантики номинативной “оболочки” терминируемого понятия. Номинативная функция термина, связанная в основном с именем существительным, может считаться главенствующей, если изучать термины изолированно от сферы функционирования и без учета понятийных и языковых связей и генезиса языка науки в целом.

Характерно, что наиболее подробные и полные классификации ориентированы на системы информационного поиска и явились итогом соединения философско-логических исследований о природе знания с прагматическими запросами информатики.

Итак, тезаурус представляет собой некую итоговую форму описания и представления систематизированного материала. Отраслевой тезаурус – это дискретный парадигматический инструмент со своим метаязыком, который может служить лингвистической моделью целостного знания, выраженного в научных текстах. Это словарь с концептуальным входом и фиксированными семантическими связями между его единицами. Функциональная значимость отраслевого тезауруса определяется тем, что, репрезентируя терминосистему науки, он одновременно является одним из наиболее оптимальных способов классификации, хранения и передачи специальной информации, средством создания поискового образа документов в электронных библиотечных информационно-поисковых системах. Концептуальный диапазон языка позволяет синтезировать информацию, сохраняя при этом потенциальную возможность этой информации к разложимости на составляющие.

Дескрипторы-термины, составляющие логико-понятийные поля тезауруса, являются одновременно вербальными элементами поискового образа документа в электронной базе данных. (В данном случае документ – это педагогическая информация, заложенная в монографии, статьи и периодические издания и подлежащая индексированию.)

Индексирование – это процесс перевода содержания документов с естественного на информационно-поисковый язык и одна из разновидностей аналитико-синтетической обработки или свертывания информации, что влечет за собой создание поискового образа документа [3]. Поисковый образ документа составляется на основе ББК, ГРНТИ, ДКД, тезауруса и словаря ключевых слов. Релевантность поискового образа документа достигается:

а) согласованностью дескрипторной строки и синтагматической цепочки;
б) соотнесенностью лингвистической семантики с логической;
в) корректным сосуществованием вербальных и символических ИПЯ.

 

Список литературы

  1. UNESCO: IBE education thesaurus, 5-е изд., 1990.
  2. Краткий словарь лингвистических терминов. М.: Рус. яз., 1995. С. 31.
  3. Гендина Н.И. Лингвистическое обеспечение автоматизированных библиотечных систем. Алма-Ата: Гылым, 1991. С. 136.


Copyright © 1995-2002 ГПНТБ России