Научные и технические библиотеки №6 2005 год
Содержание:

Евстигнеева Г.А., Земсков А.И. Мотивация научных публикаций Часть 2

Потехина Ю.В. Интернет-представительство библиотеки вуза: желаемое и действительное

Привалова Н.С. Информационная компетентность преподавателя вуза в условиях обновления образования

Кудряшова И.А. Архив JSTOR для студентов и преподавателей Дальневосточного государственного университета

Краснов И.В. Оцифровка фонда аналоговых аудиовизуальных материалов (на примере виниловых пластинок)

Ростовцев В.М. Комментарии и дополнения к статье И.В. Краснова «Оцифровка фонда аналоговых аудиовизуальных материалов…»


ПРОБЛЕМЫ ИНФОРМАЦИОННОГО ОБЩЕСТВА

Журнальный кризис – Шпрингер предпочитает эволюцию, а не революцию

Британская мозаика


СЕТЕВЫЕ ТЕХНОЛОГИИ

Земсков А.И. Составление личных хроник – blogging – модный инструмент для самовыражения

Гугл – новые достижения


ДИСКУССИОННЫЙ КЛУБ

Плешкевич Е.А. Традиционное и нетрадиционное документоведение: о чистоте идей, а может быть,  и рядов

Столяров Ю.Н. Параллельные миры документоведения


ПРОФЕССИОНАЛЬНОЕ КРЕДО

Езова С.А. Библиотекари Якутска о своей корпоративной этике


ЮБИЛЕИ

М.М. Клепикова – талантливый педагог и руководитель


Мнение читателей

Трушникова Г.А., Мозес Т.А. О роли библиотеки на информационном рынке

Ответы на письма в редакцию


НАШИ АВТОРЫ


УДК 025.4.036

Гугл – новые достижения

От редакции. Руководители и создатели ставшей в последнее время весьма популярной поисковой системы Google (Гугл) не успокаиваются на достигнутом, постоянно завоевывают новые высоты и новых почитателей, не забывая и о собственной выгоде.

В обзоре, посвященном новинкам Гугл, А.И. Земсков использовал материалы, опубликованные в журналах «Searcher» (Nov/Dec. 2004), «Online» (Nov/Dec. 2004), «Managing Information» (Dec. 2004), «Information Today» (Dec. 2003), «Information World Review» (Dec. 2004).

*   *   *

Наиболее продвинутая из существующих  ныне поисковых машин Google.com, созданная в 1998 г. 27-летним выходцем из России Сергеем Брином, согласно оценкам экспертов превосходит  конкурирующие технологии AltaVista и FAST. Гугл позволяет вести поиск на 26 языках, а деньги зарабатывает на сетевой рекламе и продаже лицензий на свою поисковую технологию. В частности, «движок» Гугл – WebSearch – использует крупнейший сетевой каталог Yahoo! и портал Netcenter, принадлежащий AOL Time Warner.

Уверенность в себе, которую излучают руководители компании Гугл – два студента Стэнфордского университета Сергей Брин и Ларри Пэйдж – вполне обоснована. Эта уверенность базируется на нескольких годах роста и успеха, завершившихся блестяще проведенным акционированием компании, в одночасье превратившим изобретателей Гугл в миллиардеров, а многих их служащих – в миллионеров.

Обещание, отраженное в Миссии компании, – «сделать мир информации более организованным, доступным и полезным для всех» – сбывается: 2004 г. войдет в историю как год Гугл. В этом году запущена поисковая машина Голиаф (Goliath), проведено весьма успешное акционирование компании на Уолл-стрит, вышла на рынок система бизнес-поиска «Appliance» («Приложения»), и конечно, замечателен дебют системы Google Print (Гугл-принт).

Гугл-принт – это инструмент для обнаружения книг, а не для чтения их от начала до конца. Именно поэтому данная система, соединившая содержание отсканированных книг с поисковыми возможностями Гугл, столь важна для специалистов по информации. Международное сообщество издателей также весьма благосклонно приняло новую инициативу Гугл и достаточно охотно отдает для сканирования принадлежащие ему публикации.

Гугл утверждает, что эта система введет вас в ту часть книги, где находится ваш поисковый термин. Приятно, что в своем новом продукте Гугл сохранил ту классическую и прославленную пользователями чистоту дизайна сетевой страницы, что особенно привлекает пользователей в основном продукте, т.е. ничего лишнего, никакого украшательства – все функционально и необходимо пользователю (а не продавцу!), все советы по навигации вынесены на левую половину сетевой страницы, в том числе и изображение обложки книги.

Навигация разбита на три группы: поиск внутри книги, книжные страницы, как купить данную книгу.

Особо нужно отметить две замечательные опции. Первая – «Поиск внутри книги»: по ключевому слову вы можете «просеять» содержание какого-либо документа, и в результате поиска система выдаст номер страницы и аннотацию. Затем, щелкнув мышью по результатам поиска, можно выйти на нужную страницу, где ключевое слово будет выделено.

Вторая опция – «О книге» – позволяет найти краткую (на одну страницу) аннотацию книги и всю библиографическую информацию. В этом же разделе представлено оглавление (чтобы пользователь мог удостовериться, что именно эта публикация ему нужна), а также отсканированное заявление об авторском праве. Вклад технологов Гугл в защиту авторских прав состоит в невозможности копирования или распечатки страниц книги.

Раздел «О покупке данной книги» отсылает к веб-сайтам электронной торговли от имени издателей или к таким розничным системам, как Amazon.com.

Уровень сканирования обеспечивает высококачественное воспроизведение страницы; в ее верхней части – заголовок книги и автор, внизу – ISBN. Пользователь может посмотреть три страницы.

 

Является ли Гугл-принт угрозой для издателей? Судя по количеству издательских компаний, участвующих в этом проекте, – нет. Необычайно высокое качество воспроизведения печатной страницы делает Гугл-принт великолепным бесплатным инструментом для научной работы и, конечно, для продвижения публикации как на сетевой, так и на традиционный рынок.

Система Гугл-принт позволяет при поиске выходить на ту книгу, в тексте которой содержится релевантная запросу информация; выдаются данные о публикации и ее доступности (адрес сетевого книготоргового магазина). На первых порах работа велась только с электронными публикациями, не имеющими печатных аналогов. В настоящее время диапазон расширен по согласованию с издателями, среди которых Blackwell, Pearson, Wiley, издательства университетов Кэмбридж, Оксфорд, Принстон и др.

Поиск осуществляется более чем по 100 тыс. книг; единственное условие – книга должна быть англоязычной и иметь ISBN. Защита авторских прав решена достаточно изящно. Пользователь получает основную информацию о книге (заголовок, автор, издатель), номер страницы, на которой найден релевантный текст, и гиперотсылку к сетевому торговцу – это может быть Amazon.com, BarnesandNoble.com или собственный магазин компании – Froogle. Дальнейший просмотр ограничен двумя предыдущими и/или последующими страницами книги по отношению к той, на которую пользователь вышел в результате поиска.

Дополнительные средства технической защиты включают в себя деактивацию функций распечатки и копирования. Некоторые издатели закрывают также доступ к особо ценным, популярным страницам, например содержащим кулинарные рецепты.

Гугл не требует своей доли оплаты от издателей или от сетевых магазинов за «наводки» на их продукцию. Как и в других системах Гугл, бизнес этой компании состоит в рекламных объявлениях на последней стадии поиска («контекстно-нацеленная реклама»).

Можно предполагать, что дальнейшее развитие Гугл пойдет также за счет работы с уже сформировавшимися технологиями электронных книг, например с системой  NetLibrary (www.netlibrary.com), в которой достаточно хорошо отработаны механизмы контроля доступа, очень похожие на традиционную библиотечную технологию. В течение долгого времени именно книжный формат по самой своей сути как-то обходился без Интернета. Инициатива Гугл возвращает книгам новый диапазон роста и развития, на этот раз в сети.

 

В 2004 г. Гугл явно выиграл гонку в сети – по количеству публикаций о нем и восторженных отзывов пользователей, по внедрению идеологии Гугл в массовое сознание. Не менее важным может оказаться и вторжение Гугл в реализацию корпоративного поиска (в противоположность частному или индивидуальному).

В течение последних месяцев 2004 г. разработанная Гугл система «Appliance» («Приложения») – простая в пользовании, как бытовой тостер, и намного более удобная, чем все другие программные разработки по бизнес-поиску – явный лидер в приобретении ее коммерческими, бесприбыльными и государственными организациями.

Можно смело сказать, что, выиграв гонку среди поисковых машин, предназначенных для работы в сети, сегодня Гугл выигрывает соревнование среди машин для бизнес-поиска – это результат анализа 26 подобных систем, выполненного в 2004 г. компанией CMSWatch.com. По мнению многих профессионалов, Гугл может служить образцом организации сетевого поиска; покупая другие системы для бизнес-поиска, люди все чаще спрашивают: а похожа ли она на Гугл?

 

Сегодня у Гугл миллионы пользователей – ежедневно 250 млн запросов на многих языках! Подход Гугл к дизайну веб-сайта – простая и лаконичная система, без глупого утомляющего украшательства и назойливой рекламы. Четкий ответ на фактически любой по сложности запрос – вот фирменный стиль Гугл. Даже в сайте, посвященном великой и могущественной компании Майкрософт, Гугл умудрился быть более информативным и полезным, чем сама компания Майкрософт. Такое ощущение, что и в отношениях с потенциальными конкурентами, Гугл придерживается своего фирменного лозунга – «Не будь гадким!».

В практической профессиональной речи (или в профессиональном жаргоне) слова Гугл и поиск стали синонимами. Даже само название фирмы обрастает легендами. Помимо отсылки к персонажу комиксов – милому увальню Барни Гуглу – апологеты компании уже привязывают ее имя к слову гугол (googol), очень близкому по написанию. Напомним, что  в популярной математике это слово означает нечто очень большое (вроде старославянского тьма), а значение гугола – 10100. (Словечко это выдумал в 1938 г. Мильтон Сиротта, 9-летний племянник американского математика Эдварда Каснера, а затем сам г-н Каснер использовал это изобретенное и красивое из-за непонятности слово в своей книге «Математика и воображение».)

Специалисты по информации настолько увлечены мощью Гугл, что ввели в обиход, быть может, несколько кощунственное обозначение BG (before Google), что означает «эпоха до Гугла» – аналогично общепринятому сокращению датировки  BC (before Christ) «до Рождества Христова».

Присутствие Гугл ощущается в работе всех крупных компаний, поставщиков информационной продукции и услуг, таких, как Lycos, IBM, AskJeeves, Microsoft. Майкрософт вообще, кажется, играет с Гугл  в «салочки – догонялки». Сегодня инженеры Гугл заняли то «водительское место» в развитии информационной индустрии, которое в свое время специалисты Майкрософт отвоевали у IBM, выдвинувшись в передовики по персональным компьютерам.

Гугл, подобно МакДональду, может заявить, что «они в год обслуживают 5 млрд посетителей». Гугл – это МакДональд в сфере информационного поиска; растет пользовательская база, количество и ассортимент предоставляемых услуг.

Гугл связан с большими деньгами; дело даже не столько в проведенном под руководством банка Credit Suisse First Boston акционировании. Руководители рекламных агентств толпой идут к Гугл, поскольку придуманная им система показа объявлений, связанных с выдачей результатов поиска, оказалась необычайно эффективной, а значит и заманчивой. Напомним, что рынок Интернет-рекламы превзошел по объему кинематографический рынок. Гугл создает то, что на языке обитателей Силиконовой Долины в Калифорнии называется экосистемой, с постоянным обновлением.

Компания буквально фонтанирует идеями и полезными интеллектуальными сетевыми поделками.

Один из новых видов обслуживания – локализация: если вы запрашиваете новости из Германии, то вам их выдадут автоматически и на немецком языке.

Недавно предложена потребителям еще одна новинка – Gmail (Google-mail), емкость 1 гигабайт, возможность поиска в сообщении.

Программа Copyscape (www.copyscape.com) позволяет автоматически сравнивать содержание двух сайтов и выделять явные повторы (т.е. плагиат), иными словами помогает авторам найти нарушения их авторских прав.

Консолидированный набор всевозможных сервисов Гугл размещен на сайте Scoople (www.scoople.com).

В ближайшие два-три года рынок бизнес-поиска может вырасти до объема в 3 млрд долларов. Речь идет о поиске и предоставлении информации, получаемой через локальную сеть организации. Задача бизнес-поиска – обеспечить конкретную организацию (предприятие) именно той информацией, которая ей нужна; быть может, довольно грубое, но понятное определение: «Бизнес-поиск – это легализованный промышленный шпионаж». Более подробное сравнение обычного сетевого поиска и бизнес-поиска приведено в таблице.

Сравнение параметров обычного сетевого поиска и бизнес-поиска

Публичный поиск в Интернете (Гугл)

Бизнес-поиск в Интернете (Verity 2)

За поиск платит рекламодатель. Для пользователя поиск бесплатен

Стоимость поиска оплачивает организация. Для пользователя поиск бесплатен

«Умные» алгоритмы готовы дать ответ на запрос в любой момент. «Поиск – это волшебство», – как сказал пользователь

Доставка специфических массивов информации задается запросами, которые хранятся в памяти системы, реакцией специалистов и усовершенствованными алгоритмами

Результаты поиска демонстрируются немедленно, разве что с задержкой, вызванной пропускной способностью пользовательского канала

Результаты могут проявиться через какой-то значительный период времени. Отладка режима поиска может оказаться значительно более сложным процессом, чем предполагалось вначале

Простой, ясный пользовательский  интерфейс с указателем типа «найди и щелкни» и стандартным поисковым окном

Не существует общепринятого способа предоставления результатов бизнес-поиска

Фокусирование интересов на массовом рынке

Фокусирование на интересах отдельного подразделения  или на каких-то специальных задачах. Любая организация не может считаться аналогом массового рынка; скорее, это некая федерация специальных потребностей

Выдача результатов в обычных для Интернета форматах: HTML, Word, XML, .pdf

Абсолютно различные типы файлов: от типично интернетовских до каких-либо специальных разработок

Системы поиска и доставки легко автоматизируются

Системы поиска и доставки результатов нуждаются в формулировании дополнительных логических требований: как работать со специальными  видами документов, какие права доступа имеют различные категории пользователей, а также многие иные ограничительные мероприятия

Обычные автоматизированные системы («пауки») и технология «проталкивания» обеспечивают индексацию и доставку необходимого материала

Используется комбинация технологии автоматического индексирования («пауков»), «проталкивания», а также специализированные разработки

Обновление задается индексирующей системой

Материал индексируется по программе, составленной исходя из интересов бизнеса, в том числе и в режиме реального времени

Безопасность обеспечивается стандартными средствами

Безопасность ставится во главу угла. Доступ, проверка списка пользователей,  предотвращение взлома сайта хакерами и другие меры безопасности входят в число наиболее приоритетных

Эксплуатация осуществляется специально выделенной группой инженеров  и специалистов по анализу содержания

Выделенные инженеры и специалисты не предусмотрены

Обычно бывает достаточно ощущения, что работа организована «довольно хорошо»

Обычно предполагается, но не всегда реализуется концепция дублирования и преодоления нештатной ситуации. Любая неполадка воспринимается с дрожью в коленках

Желательно получение результатов, удовлетворяющих конкретное лицо. Повсеместно распространены реклама, объявления и т.п.

Желательно получение объективных результатов. Обычно дополнительная информация ограничивается нуждами самой организации (учреждения, предприятия)

Широко распространено отслеживание того, как используется данный материал

Анализ использования выливается в непростую проблему. С одной стороны, отслеживание помогает решению проблем регулирования, безопасности и лицензирования. В то же время излишнее внимание может привести к потери доверия

 

Преимущество Гугл на данном направлении бизнес-поиска состоит в том, что пользование его системой очень простое. (Забавная иллюстрация: один из руководителей компании, входящей в список первых 500 по версии газеты «Файненшнел Таймс», задает весьма развернутый вопрос: «Поиск внутри документов нашей компании должен работать, как Гугл. Мгновенно. Просто. Выдача результатов – на первой странице. Неужели это так сложно?» И получает лаконичный ответ «Да, это очень сложно! Организовать поиск так, как это делает Гугл, очень и очень сложно!».)

Еще одна, всем известная изюминка Гугл – собственный, нестандартный и неформальный подход к оценке результатов поиска. Алгоритм Гугл полагается не столько на нейтральные, безусловно объективные, но чаще всего бесполезные формальные данные о релевантности и пертинентности найденных документов, а работает «как все люди». Алгоритм ранжирования учитывает наличие и количество у найденной сетевой страницы гиперсвязей с другими активными (подчеркиваем, активными!) страницами сети, анализирует разговоры в сети (чаты), доски объявлений и другие проявления реальных интересов реальных пользователей. Проще говоря, алгоритм «прислушивается» к тому, что люди говорят о конкретном документе, и если говорят хорошо, то именно этот документ и возглавит список результатов поиска. Такой подход в чем-то копирует систему обмена научной информацией: известно, что у ученых на первом месте по значимости источников информации стоят не прочитанные материалы, а результаты живого обсуждения с коллегами, на семинарах, конференциях и т.п.

И наконец, не следует забывать о финансовой мощи. После недавнего выхода на рынок поставщиков информации и на биржу, Гугл стоит больше, чем такие известные компании, как  Autonomy, Convera, Fast, вместе взятые! Это значит, что очень скоро все поставщики информации почувствуют присутствие на том же секторе рынка сильного, активного, умного и очень богатого конкурента.

 

Гугл стал синонимом быстрого и простого поиска. Вечно занятому потребителю нужен результат поиска, а не лекция о поисковых машинах или особенностях лингвистической обработки естественного языка, байесовой статистике и таксономии.

Ценовая политика Гугл также весьма разумна: стоимость его систем бизнес-поиска от 40 тыс. до 250 тыс. долларов, а другие компании запрашивают более 1 млн долларов.

Компания OCLC объявила, что ее сетевой доступ к проекту Open WorldCat pilot будет осуществляться с помощью поисковой системы Гугл. Цель проекта – вывести пользователя непосредственно на ближайшую к нему местную библиотеку, в которой имеется необходимый ему документ. В этом проекте используется часть массива – всего лишь 2 млн библиографических записей из общего количества 53 млн, которыми располагает WorldCat.

Google Toolbar получил в 2003 г. приз Ассоциации независимых профессионалов по информации как лучший программный инструмент года.

 Компания Гугл наконец проявила себя и на рынке научного поиска, открыв бета-версию сайта Google Scholar (www.scholar.google.com). Система в первую очередь предоставляет доступ к статьям и рефератам, опубликованным в рамках технологии открытых систем и отраслевых (ведомственных) репозитариев. При ранжировании выдачи система учитывает в виде отдельного списка индекс цитирования каждого из найденных документов. Главный инженер проекта Анураг Ачарья (Anurag Acharya) утверждает: «Мы охватываем всех основных издателей научной литературы». Кое-кто высказывает опасение, что эта система превратит сотрудника научно-технической библиотеки в ящик для мусора. «Ничего подобного, – парирует Ян Велетроп (Jan Veletrop), издатель нового журнала «Biomed Central», – создание репозитарных систем при развитии Google Scholar становится императивом, а функции репозитария и библиотеки очень близки – это организации, занятые распространением информации. Google Scholar скорее является конкурентом таких новых систем, как Web of Knowledge компании ISI или Scopus, поставляемый издательством Elsevier, поскольку Google Scholar лучше названных систем, предоставляется бесплатно и может «добывать» информацию, расположенную очень «глубоко в сети».

Позиция Яна Велетропа не может быть нейтральной, поскольку его журнал представляет собой в чистом виде элемент системы открытого доступа (автор оплачивает публикацию и затем доступ к ней бесплатен). По мнению редактора журнала «Information World Review» (Dec. 2004. Iss. 208. Р. 2) Боба Пикеринга (Bobby Pickering), «появление Google Scholar для прежних лидеров информационной индустрии – это как столкновение Титаника с айсбергом. Представители старой гвардии еще танцуют в бальном зале, передвигают стулья поближе к сидящим дамам, не понимая, что происходит на самом деле и что их ждет». И тем не менее, считает Б. Пикеринг, все к лучшему: напор компании Гугл заставит традиционных издателей пересмотреть цены и условия в сторону, благоприятную для пользователей; авторы по мере набора материала в системе репозитариев, станут перекочевывать туда. Время на стороне Гугл.

  
На главную