NTB_11

Научные и технические библиотеки

От редакции. Следуя нашей политике ознакомления читателей с новейшими технологическими достижениями в сфере информационно-библиотечной деятельности, мы публикуем в этом номере переводы двух статей из журнала Information World Review Dec. 2001, N 175. Данный выпуск журнала был приурочен к проведению ежегодной конференции и выставки Online 2001 в Лондоне (см. Науч. и техн. б-ки. 2002, N 3. C. 163-165).

Не вдаваясь в подробности, напомним, что разработанный одним из первых стандартизованный язык общей разметки SGML позволял обрабатывать внешний вид материала (размер, тип и вид шрифта текстовых документов, начало строки или абзаца, включение графики или рисунка и т.п.).

Пришедший ему на смену язык гипертекстовой разметки HTML, который сейчас широко применяется при подготовке материалов веб-страниц, позволял, помимо вышеназванных формальных согласований вида текста, также создавать гипертекстовые отсылки (гипертекстовые связи), включать в сетевой документ нетекстовые материалы (изображения, графику, звук, видео).

Сегодня настала пора и появились возможности внедриться не в форму предоставления, а в содержание документа. Стандартизованный язык обработки получил название расширяемый язык разметки – XML (eXtensible Markup Language).

Стандартизованные знаки разметки (тэги) ставятся не только для обозначения типа или размера шрифта, но и для выделения ключевых слов, индексов и других параметров текста, относящихся к содержанию. Такой подход дает возможность автоматически производить очень многие операции смысловой обработки материала.

УДК 004.738.52

Флад Г.

От сети – к сетке

Мировая паутина World Wide Web существует более 10 лет. Создатель сети Тим Бернерс-Ли (Tim Berners-Lee) полагает, что пришла пора придать ей новые интеллектуальные свойства.

Компания Майкрософт (Microsoft) сейчас часто показывает короткий рекламный ролик, иллюстрирующий основные принципы и преимущества своего нового сетевого проекта .NET. Если вы еще не познакомились с содержанием ролика, то скажу, что речь идет о некоем бизнесмене (зовут его Стив), у которого несчастная привычка – оказываться на пути велосипедистов. На экране мы видим бедного Стива лежащим на мостовой в Сан-Франциско – это не его родной город. С помощью карманного портативного компьютера (персональный цифровой помощник – Personal Digital Assistant, PDA) Стив находит ближайшего доктора. То, что за этим следует – пример того, как персональные финансовые данные Стива – общая страховка, медицинская страховка, медицинская карта и т.п. – передаются по сети и при этом сам Стив может вмешаться в их передачу в режиме реального времени. Стив общается с приемным отделением больницы, гарантирует им оплату услуг, получает необходимые консультации, наконец поднимается на ноги ... но лишь для того, чтобы снова оказаться на пути другого нахального велосипедиста!

Сотрудники Майкрософта утверждают, что в этом рекламном ролике – пример того, как хороша будет наша жизнь после наступления золотого века системы .NET.

В мае этого года в журнале "Scientific American" появилась статья, главный герой которой Пит помогает сестренке Люси оказать медицинскую помощь больной маме. Со своего карманного компьютера Пит выходит на сетевые материалы по финансовым и медицинским проблемам с тем, чтобы помочь организовать лечение: в режиме реального времени находит необходимую информацию, в том числе и о стоимости терапевтических процедур и т.д... Полагаю, довольно легко вы можете додумать все остальное.

Мы далеки от того, чтобы обвинять Майкрософт в краже сценария у авторов статьи. Среди последних – сам Тим Бернерс-Ли, отец всемирной паутины World Wide Web.

Чем бы ни занимался Тим Бернерс-Ли, это всегда вызывает интерес. А когда речь идет о весьма амбициозной попытке создать интеллектуальную мировую сеть, можно понять и простить сотрудников Майкрософта. Можно предположить, что система .NET или конкурирующая с ней система ONE компании Sun Microsystems и есть воплощение проекта г-на Бернерс-Ли. Но это отнюдь не так. Речь идет о намного более амбициозном или даже зловещем замысле.

Целью г-на Бернерс-Ли является то, что он называет семантической сетью. Под этим подразумевается создание интеллектуальных клиентских программ, которые позволят понимать значение и смысл (семантику) той информации, которую они перебирают; это сделает любой поиск изначально осмысленным и предельно эффективным.

"В том, что касается данных, мы живем в досетевой эпохе, – заявил недавно Бернерс-Ли. – Мы расходуем огромные суммы денег на оплату консультантов-интеграторов, которые анализируют данные какой-то одной компании и передают их другой компании. Именно здесь заложена возможность применить сетевые технологии. В сети имеется информация, в наличии и ясные математические алгоритмы, которые могут определять данные. И если мы сумеем создать язык, распознающий результаты работы программ, то дело за коммуникациями. Создание возможности распознавания данных, проанализированных компьютером, может оказаться в перспективе весьма значительным шагом".

Как считает Жак Хале (Jacques Hale'), руководитель аналитической группы Великобритании, всю жизнь работающий над проблемами искусственного интеллекта, "Бернерс-Ли, конечно, не единственный человек на Земле, думающий над этими проблемами, но сила его предвидения колоссальна. Все яснее и яснее видно, что мы достигли некоего потолка и на основе существующей булевой логики запроса не сможем двигаться дальше, не преодолев проблемы семантики".

Но как сделать этот следующий шаг? Это большая проблема, считает г-н Хале: "Используя сегодняшние возможности сети, вы не сможете получить удовлетворительный ответ на очень простые, приземленные вопросы. Сделайте запрос: Хочу купить в Бостоне желтый автомобиль; и компьютер, или поисковая сетевая машина, которая все знает о Бостоне, штат Массачусетс, об автогигантах типа Хонды и т.д., но не знает желтого цвета, не сможет соединить эти слова, сникнет. Оказывается, что все это представляет собой довольно сложную проблему, в решении которой придется прибегнуть к нескольким методикам поиска ответа. Здесь вы вступаете в царство сетевых запросов, взаимодействующих сетевых агентов, пытаясь превратить ресурсы Интернета в единую распределенную поисковую машину".

По мнению г-на Хале, недавние объявления о разработке концепции "сеточного" проведения вычислений, т.е. формирования в каждом случае огромных сетей из компьютеров, подключенных к Интернету, и составит часть инфраструктуры будущей интеллектуальной сети. В этом смысле работы Бернерс-Ли представляют собой одно из первых предложений по составу будущей сети.

Но не будем забывать об онтологии и связанных с этим проблемах. Онтология – это часть концепции искусственного интеллекта, и в вопросе формирования будущей сети она займет самое существенное место. Это изучение того, как мы, люди, классифицируем мир, каким образом мы узнаем, что, например, слово золото в разных случаях обозначает один из металлов, минерал, что-то драгоценное, цвет предмета.

Все это очень сложные проблемы, которые мы пока не решили, но должны решить. Во времени это растянется не менее чем на 10 лет. Сетевые системы, подобные .NET, безусловно, окажутся полезным приложением, но прежде нам следует решить проблемы работы с метаданными. Наблюдатели, и в их числе г-н Хале, считают, что нужно всячески приветствовать создание семантической сети, но так думают далеко не все специалисты.

Вот мнение Тома Уэлша (Tom Welsh), независимого консультанта по программам, который имеет более чем 20-летний опыт работы в крупнейших организациях, таких, как DEC и Compaq: "Я глубоко сомневаюсь в любых планах, направленных на то, чтобы компьютеры управляли нашей жизнью, поскольку даже наиболее глубоко продуманной программе это не по силам. Столь велики будут возможности ошибиться и столь опасны будут последствия ошибки, что реализация таких планов окажется несчастьем". Г-н Уэлш также считает, что основное препятствие – это онтология. "Все мы знакомы с идеей построения тезаурусов, но вряд ли кто-нибудь согласится с таксономическим описанием реального мира, и мне трудно понять, как компьютеры смогут лучше нас справиться с ситуацией".

И конечно, остаются проблемы неправильного или злонамеренного использования.

Т. Бернерс-Ли всю жизнь работал в составе закрытого, благонамеренного и доброжелательного сообщества. И сеть сама по себе изначально создавалась как своего рода библиотека, в которой исследователи могли бы просматривать работы других ученых непосредственно по ходу их исполнения.

Сеть в свое время была создана как очень рыхлая, свободная структура: при возникновении проблем вы просто прекращали работу в ней и выдавали сообщение "404".

Новые подходы требуют совершенно другой, намного более четкой организации сети. Кроме того, сейчас сеть превратилась в бизнес-площадку, используемую также для пропаганды, маркетинга и извлечения огромных денежных сумм.

"С этой точки зрения интересы коммерческих организаций окажут сильнейшее влияние на окончательный выбор онтологии. И если программисты, работающие в крупных компаниях, не согласятся с предлагаемыми семантическими решениями, ничего не выйдет, и голос простого человека ничего не значит". По этим причинам г-н Уэлш настаивает на предельной осторожности и неспешности. "Мне ненавистен образ современного обывателя – бизнесмена, всегда требующего дать ему немедленное решение. Когда мне нужна информация по системе страхования, я обращаюсь к моему финансовому советнику, а не направляю запросы в сеть. Все это не имеет очевидной выгоды или пользы для простых людей, и любая новая технология должна продемонстрировать свое преимущество и обозначить подводные опасности. Для того чтобы создать нечто подобное, понадобятся совершенно чудовищные капиталовложения, и все же пройдет не менее 25 лет, пока что-либо из обсуждаемого сейчас сможет воплотиться в жизнь".

Итак, две противоположные точки зрения на проблему.

Г-н Хале считает, что будущее достаточно ясно обозначено: "Специалисты по информации должны непрерывно отслеживать такие технологические достижения, как семантически структурированная сеть, однако не следует надеяться на быстрое получение конечного продукта. Но мы обязательно придем к этому, и требуется своевременная подготовка и углубление наших знаний по тем метаданным, которые нужно будет описывать".

По мнению г-на Уэлша, семантическая сеть никогда не обретет крыльев, необходимых для взлета. "Для реализации этих идей нам понадобится разработать такое программное обеспечение, которое должно быть столь же умным, сколь и мы с вами. Это потребует многих лет".

Суть дела в том, что оба они – и Хале, и Уэлш – правы. Потому что, нравится вам это или не нравится, но для совершенствования сети все равно понадобится создавать какую-то классификационную базу – в духе идей Бернерса-Ли. Мы действительно нуждаемся в построении более интеллектуальной сети.