УДК 02+002

А. И. Земсков
ГПНТБ России

Что нового в мире научных публикаций

Аналитический обзор материалов, опубликованных в выпуске журнала «Research Information», приуроченном к Франкфуртской книжной ярмарке 2014 г.

Ключевые слова: научные журналы, псевдобренды, открытый доступ к информации, массовые онлайновые открытые курсы, облачные технологии, альтметрики.

UDC 02+002

Andrey Zemskov

Russian National Public Library for Sci & Tech
What’s news in the world of scientific publications

Analytical review of publications in Research Information journal issue timed to coincide with 2014 Frankfurt Book Fair

Keywords: scientific journals, pseudo brands, open access to information, popular online open courses, cloud technologies, altmetrics.

Я предлагаю читателям нашего журнала краткий и субъективный обзор некоторых материалов, опубликованных в выпуске журнала «Научная информация», приуроченном к Франкфуртской книжной ярмарке 2014 г. (Research Information. – October/November 2014. – Issue 74).

Формат обзора хорош тем, что позволяет смело высказывать собственные суждения по поводу рассматриваемых материалов и добавлять к ним комментарии. Пересказ, в отличие от перевода (что, кстати, требует специального разрешения), даёт возможность селективно подходить к оригинальному тексту, выявлять те моменты, которые могли бы заинтересовать читателей, в частности журнала «НТБ».

Для пересказа и обсуждения я выбрал следующие темы статей данного выпуска:
«Воровство научных журналов открытого доступа (жульнические псевдобренды)»;
«Рецензирование после опубликования («народное рецензирование»)»;
«Что ждёт массовые онлайновые открытые курсы дистанционного обучения (MOOК) после их взлёта и падения?»;
«Светлое будущее облачных библиотечных технологий»;
«Развитие альтметрик».

Воровство научных журналов открытого доступа
(жульнические псевдобренды)

В статье «Угонщики журналов целятся в науку и в открытый доступ» (Journal hijackers target science and open access), основанной на материалах интервью с работающим в Иране врачом, журналистом и исследователем Мехрдадом Джалаляном (Mehrdad Jalalian), рассматривается угроза научному общению, исходящая от околонаучных ловкачей и жуликов.

Это явление возникло около двух лет тому назад. Суть его в том, что киберпреступники создают контрафактные веб-сайты, имитирующие сайты настоящих журналов, зазывают авторов, подрывая тем самым репутацию учёных посредством публикации неотрецензированных статей на своих фальшивых сайтах и воруя их деньги. Авторы считают, что их репутации наносится ущерб, а мотивация к проведению исследований снижается. Страдают при этом и настоящие журналы – они теряют авторов, читателей и репутацию. Более того, появление непроверенных сообщений о полученных научных результатах может увести дальнейшие исследования на ложный путь.

С начала 2012 г. М. Джалаляну стали поступать сообщения о том, что некоторые журналы, числящиеся в рейтинге Thomson Rheuters’ Journal Citation Report, принимают все материалы без разбору и по любой отрасли науки – лишь бы автор заплатил за публикацию несколько сотен долларов. Проведя проверку, М. Джалалян обнаружил недавно зарегистрированный второй веб-сайт журнала «Archives des Sciences»; в переговорах с представителями настоящего журнала выяснилось, что речь идёт о подделке.

Совершенно невозможно научить всех читателей отличать настоящий журнал от «угнанного». Тем не менее, определённые рекомендации имеются. Во-первых, следует публиковать и обновлять список фиктивных журнальных сайтов; к середине 2014 г. такой список насчитывал более 30 наименований и быстро рос (см. веб-сайт автора: http://www.mehrdadjalalian.com/index.php/list-of-hijacked-journals-and-fake-publishers/30-hiajcked-journal-list-2014-first-edition-june-2014). Во-вторых, хорошо бы организовать семинар по обучению правилам детектирования фальшивых сайтов. И наконец, стоит разработать количественные методики оценки качества научных исследований и научных публикаций, основанные не только на стандартных метриках.

Дело в том, что рецензирование и редактирование являются очень важными элементами поддержания высокого качества научных публикаций. Детальные сведения об экономике научных публикаций и очень полезная для авторов и руководителей редакций научных журналов статистика содержатся в обширном докладе (2009 г.) профессора Хаутона (Houghton) и других авторов (Economic Implications of Alternative Scholarly Publishing Models. Exploring the costs and benefits JISC EI-ASPM Project). Таблицы 1–3 взяты из этого исследования; ссылки на работы известного специалиста и активного лектора профессора Кэрол Тенопир (Carol Tenopir) и её коллег даны также по этому докладу.

Приведённые данные могут оказаться интересными с точки зрения повышения качества публикаций в российских научных журналах. (Более детальную и полную информацию см.: http://webarchive.nationalarchives.gov.uk/20140702233839/http://www.jisc.ac.uk/media/documents/publications/summary-economicoa.pdf)

Таблица 1

Трудоёмкость научного общения

Параметр
Значение
Источник
Время, необходимое для написания научной статьи От 50 до 100 часов(в среднем 95 часов) Tenopir and King (2000), King (2004)
Время, необходимое для рецензирования научной статьи 3–5 часов (в среднем 4,5 часа) Tenopir and King (2000), King (2004)
Количество рецензентов на одну статью 2–3 Оценки издателей
Количество отклонённых статей и представленных повторно Отклоняются 50% статей, из них 60% направляются на «внешнее» рецензирование; 40% отклоняются без дополнительного изучения; при этом 75% отклонённых статей больше не подаются Оценки авторов статей
Время, израсходованное на редактирование От 10 до 30 дней в год (в среднем 20 дней) Оценки издателей
Время, израсходованное на проведение редколлегии От половины дня до одного дня в год Оценки издателей
Доля авторов, которые являются редакторами или входят в редсоветы Соответственно 8% и 24% Rowlands and Nicholas (2005)
Количество прочитанного в год на одного учёного В промышленности:
130 статей,
53 книги,
65 отчётов,
51 ед. коммерч. лит., 22 ед. – иное;
в высшем образовании:
280 статей,
48 книг,
46 отчётов,
74 ед. коммерч. лит.,
14 ед. – иное
Tenopir and King (2000), Tenopir at al. (2008)
Время, израсходованное на чтение статьи Около 31 минуты Tenopir and King (2007), Tenopir at al. (2008)
Время, израсходованное на поиск статьи 8–17 минут(в среднем 12,5 минут) Tenopir and King (2007), Tenopir at al. (2008)
Отношение количества запрошенных статей к количеству прочитанных 1,3–1,4 Tenopir and King (2000)
Время, затраченное авто-ром на получение разрешения на публикацию 1–4 часа (в среднем 2 часа) Halliday and Oppenheim (1999)

Таблица 2

Трудоёмкость научного рецензирования

Параметр
Значение
Источник
Внешнее рецензирование заявки на грант 3–6 часов на отзыв (в среднем 5 часов) Tenopir and King (2000), time to review a journal article
Количество отзывов на один грант От 2 до 5 на одну заявку (в среднем 3) Консультации в Научном совете
Стоимость научного рецензирования (фунты стерлингов) От 40 до 93 за час работы (в среднем – 56) Статистика зарплат в высшей школе
Объём одной статьи От 11,7 до 14,3 с. (средний – 12,4) Tenopir and King (2000)
Количество статей в выпуске От 10 до 20 Tenopir and King (2000)
Количество выпусков в год От 8 до 16 Tenopir and King (2000)
Количество статей в год От 50 до 150 (в среднем 120) Tenopir and King (2000)
Доля страниц, не относящихся к статьям От 10% до 20% (в среднем 14%) Tenopir and King (2000)
Доля отклонённых статей От 40% до 60% (20% статей отклоняется без рецензирования) Литературные данные
Объём подписки на одно наименование журнала От 300 до 3 000 (среднее – 1 200) Tenopir and King (2000)
Накладные расходы 20% – 25% CEPA (2008)
Уровень рентабельности 10% – 30% (в среднем 20%) CEPA (2008)
Заказ и доставка формата e-only по отношению к печатному 25% CEPA (2008)
Расходы на обработку содержания документа формата e-only по отношению к печатному 25% CEPA (2008)
Доля расходов на управление правами на Открытый доступ (в общих расходах) 20% Оценки авторов доклада
Доля расходов на обслуживание читателей, работающих с материалами в Открытом доступе (в общих расходах) 20% Оценки авторов доклада
Доля расходов на маркетинг и поддержку при использовании модели «золотого доступа» ОД (в общих расходах) 33% Оценки авторов доклада
Доля расходов на хостинг при использовании модели репозитариев (в общих расходах) 50% Оценки авторов доклада
Доля расходов на управление и инвестиции при использовании моделей ОД (в общих расходах) 75% Оценки авторов доклада
Рентабельность ОД 75% Оценки авторов доклада

Определение открытого доступа (ОД), предлагаемое Ларсом Бьорнсхаугом, директором библиотеки университета г. Лунд (Швеция): «Журналы открытого доступа – это такие журналы, финансовая модель которых не предполагает взимания платы за доступ с читателей или с представляющих их интересы учреждений». В течение ряда лет развиваются два основных направления ОД к рецензируемым научным документам – «золотое» (gold) и «зелёное» (green).

Долгое время оба варианта считались равноправными, но в последние годы различия в этих бизнес-моделях стали очень заметными. Канадский ученый Джон Харнад (John Harnad) так определяет «золотой» и «зелёный» варианты: «Золотой» ОД означает, что журнал не требует денег за доступ читателя к электронной статье, опубликованной в нём. «Зелёный» вариант означает разрешение размещать отрецензированные материалы в общедоступных сетевых институциональных репозитариях или в центральных репозитариях ... Жаль, что один и тот же термин «открытый доступ» применяется к обоим вариантам, поскольку их значение совершенно различно».

Проблемой «золотого» ОД является то, что он требует значительной оплаты от автора. По сути – это чисто коммерческая модель, ещё более выгодная для издателей, чем модель подписки.


Рис. 1. Схема различных вариантов публикаций ОД

Идеология журналов ОД разработана и поддержана в рамках проекта коалиции СПАРК. (SPARC (Scholary) – Publishing and Academic Resources Coalition – Коалиция научных изданий и академических ресурсов – организация библиотечных сообществ, выступающая за расширение свободного доступа к знаниям.) Суть технологии: материал проходит научное рецензирование, оплачивается и затем предоставляется бесплатно.


Рис. 2. Схема последовательности действий, приводящих к публикации журналов ОД

Оплата обработки статей (ПОС) – Article Processing Charges (APCs) – это основной механизм финансирования научных публикаций ОД. Эта технология стартовала в 2002 г. по инициативе двух профессиональных издательств – Public Library of Science (PLoS) и BioMed Central (BMC): они организовали выпуск журналов, рецензирование и редактирование которых осуществлялось за счёт либо авторов, либо тех организаций, где они работают, либо грантодателей. Количество таких журналов быстро росло, как и объём соответствующих изданий, и многие издатели традиционных журналов также подключились к использованию этой бизнес-модели.

Авторы работы «Исследование журналов открытого доступа, использующих механизм оплаты публикации статей за счёт автора» (A Study of Open Access Journals Using Article Processing Charges) – Дэвид Соломон (David J. Solomon) и Бо Кристер Бьорк (Bo-Christer Bjork) – изучили 1 370 наименований журналов (в основном биомедицинского профиля) из коллекции DOAJ, в которых было опубликовано 100 697 статей в 2010 г. Список некоторых издателей, включённых в исследование, приведён в табл. 4.

Таблица 4


Список некоторых издателей, использующих технологию ОД

Издатель
Страна
Количество журналов
Количество статей
1 Bentham Open Арабские эмираты 211 1 941
2 BioMed Central Великобритания 193 16 066
3 Hindawi Publishing Corporation Египет 132 3 943
4 Dove Medical Press Новая Зеландия 81 2 034
5 Libertas Academica Новая Зеландия 58 459
6 Scientific Research Publishing США 48 2 279
7 Frontiers Research Foundation Швейцария 26 1 152
8 MDPI AG Швейцария 25 3 957
9 AIRCC Индия 21 624
10 Canadian Center of Science and Education Канада 20 1 877

Средняя стоимость обработки статьи составляла 904 доллара США (от 8 долларов – в журналах, выходящих в развивающихся странах, и до 3 тыс. долларов – за публикацию в высокоавторитетных журналах).

По состоянию на авг. 2011 г. в каталоге DOAJ насчитывалось уже 1 825 наименований таких журналов, т.е. примерно 26% от общего количества журналов ОД в DOAJ. Единая стоимость обработки статьи – 3 тыс. долларов, которую установило издательство «Springer», по-видимому, оказалась определённым стандартом и для других издателей. Отметим, что в исследовании группы Хаутона (Houghton et al, 2009) ориентировочная стоимость обработки составляла 3 247 фунтов за «гибридную» (печатная и электронная версии) статью, 2 327 фунтов – за электронную версию и 1 524 фунта – за статью в ОД.

Пожалуй, наиболее полное изучение проблемы ОД было проведено в рамках проекта Европейского Сообщества – Study of Open Access Publishing, SOAP (Dallmeier? Tiessen et al, 2010). Было рассмотрено 2 823 наименования англоязычных журналов в DOAJ; опрошено 23 тыс. авторов статей: половина из них ничего не платили за публикацию, только 10% заплатили более 1 тыс. евро; 12% платили сами, 59% воспользовались финансированием по грантам, 24% получили поддержку от своей организации. Уровень оплаты статей по разным дисциплинам и в разных странах существенно различается.


Рис. 3. Суммарные затраты на оплату обработки статей в журналах ОД по различным научным дисциплинам, тыс. долларов США (данные за 2010 г.)

Какие выводы можно бы сделать нам, российским авторам и библиотекарям, из этого сообщения?

1. Принципиальное, честное научное рецензирование – дорогостоящий, но совершенно необходимый элемент научных публикаций. К сожалению, это не всегда получается. Мой личный опыт (изучение нескольких ведущих российских научных журналов и подготовка рефератов для профессионального издания «Zentralblatt fur Mathematik»), показывает, что достаточно часто благополучно проходят редколлегию и публикуются очень незначительные по смыслу статьи (например, автор лишь немного изменил параметр или начальные условия и спешит сообщить об этом). Встречаются также и случаи откровенного кумовства, землячества или присоединения фамилий родственников к автору статьи.

2. Мне неизвестны случаи «угона» веб-сайтов российских научных журналов, может быть потому, что в нашем научном сообществе ещё не освоили бизнес-модель публикаций по «золотому» варианту ОД. Но зная сноровку наших граждан в деле освоения новых технологий, стоит предвидеть потенциальные угрозы.

Рецензирование после опубликования
(«народное рецензирование»)

Консультант по вопросам подготовки научных публикаций Анна Шармэн (Anna Sharman) в статье «Авторам следует готовиться к комментариям после публикации» (Authors should prepare for post-publication review) пишет: традиционно авторы стремятся опубликовать свои работы в журналах наиболее авторитетных, с как можно более высоким импакт-фактором; работа рецензируется двумя или тремя коллегами и в случае положительных отзывов принимается в печать; автору остаётся включить эту работу в список своих научных трудов и принимать поздравления.

Однако положение меняется. Во-первых, традиционная система анонимного рецензирования перед публикацией работы сейчас критикуется за то, что не смогла выявить такие проблемы, как, например, сообщения о якобы возможности существования жизни на основе мышьяка или скандал (и последовавшее самоубийство японского учёного) с двумя отозванными статьями в журнале «Nature» о стволовых клетках. Эти случаи показали, что даже наиболее авторитетные рецензенты могут не заметить ошибки в исследованиях.

Во-вторых, создан новый тип журналов – так называемые мегажурналы с очень широким диапазоном научной тематики – это, например, «PLOS ONE» (все области науки и медицины), «SpringerPlus» (все научные дисциплины) и «SAGE Open» (полный спектр общественных и гуманитарных наук). Это, скорее тематические электронные библиотеки – не случайно аббревиатура PLOS (Public Library of Science) означает Публичная научная библиотека.

Первый мегажурнал «PLOS ONE» был основан в 2006 г. Сейчас это крупнейший научный журнал мира, который в 2011 г. опубликовал 13 798 статей, в 2012 г. – 23 468 и в 2013 г. – 31 500. По оценкам 2012 г., этот журнал напечатал 3% мировых публикаций по науке, технике и медицине.

Появление названных выше журналов полностью перевернуло все традиции научного издательства, сложившиеся за последние 40 лет.

Очень важно, что эта бизнес-модель выгодна издательствам: вместо содержания множества узкоспециализированных журналов с различными условиями приёма статей к публикации удаётся сформировать интегрированную систему для единого журнала. Существенно снижаются и затраты в связи с многократными циклами подачи – отказа статей.

Мегажурналы оказывают влияние и на природу исследований. Репутация учёного базируется на его публикациях, при этом авторы стремятся к опубликованию, а редакторы, редсоветы и рецензенты являются хранителями традиций качества.

Оценка качества мультиотраслевых работ возможна только после публикации.

Известно, что многие исследователи (особенно в биологии и физике) размещают свои препринты в сети, что привело к созданию журналов, выполняющих рецензирование после публикации.

Всё это означает, что пришла пора организовать систему постпубликационного рецензирования. В последние годы такого рода комментарии появились в социальных сетях, в частности на Twitter, а сервисы Altmetric или ImpactStory собирали эти комментарии и связывали их с оригинальной статьей, но всё это не имело большого значения.

С появлением централизованных платформ PubPeer и PubMed Commons положение изменилось. Система PubPeer допускает анонимное комментирование всеми членами академического сообщества. При знакомстве с текстом статьи будут видны и комментарии. Система PubMed Commons допускает комментарии от авторов статей в журнале «PubMed»; эти комментарии появятся сразу же за аннотацией на статью.

Авторы статей должны знать о существовании таких систем и быть готовы отвечать на вопросы и замечания читателей, игнорировать их не удастся. Нужно сказать, что такая практика не только привлекает многих авторов к исправлению допущенных ошибок, но может также иметь и иной позитивный эффект, поскольку новые метрики, в том числе массовое одобрение, приходят на помощь технологии, базирующейся на величине импакт-фактора. Поэтому авторам придётся более тщательно подходить к написанию статьи, хотя не всегда это удаётся сделать своими силами – из-за эффекта «замыленных» глаз. Коллеги же не всегда имеют достаточно свободного времени – они заняты собственными исследованиями. На помощь может прийти компания «Cofactor», которой руководит Анна Шармэн, и «свежим» глазом внести необходимые поправки.

Какие комментарии я могу добавить?

1. Методология приглашения пользователей к оценкам законченного произведения хорошо известна.

Некоторые библиотеки уже много лет практикуют допуск читателей к специальным полям своих электронных каталогов. В эти поля читатели вносят отзывы о конкретном документе – позитивные и негативные. Такая практика позволяет другим пользователям точнее сориентироваться при выборе литературы.

Определённое родство технологии постпубликационного комментирования и оценок можно найти и с недавно возникшей в среде научных и вузовских библиотек системой «Комплектование по заказу» (Acquisition on demand, Patron driven acquisition): после предварительного ознакомления с электронной публикацией пользователь даёт своё заключение о целесообразности её приобретения в фонд.

Интереснейший проект оцифровки рукописей Британской библиотеки – British Library Manuscripts 2.0. Интеграция ресурсов из различных библиотек – Британской библиотеки, Российской национальной библиотеки и Национальной немецкой библиотеки (Лейпциг) – позволила наиболее полно восстановить частично утраченные элементы Синайского кодекса.

Каждая страница электронного документа представляет собой тщательно восстановленное изображение, содержащее наиболее хорошо сохранившиеся в различных оригиналах фрагменты; перевод текста рукописи; заметки о проблемах консервации этой части документа. Созданы возможности обогатить научными комментариями любую часть документа, а также обеспечить «социальное группирование» (social networking), т.е. выявить людей, интересующихся этим предметом, и сформировать сообщество специалистов.

2. Рассматривая некоторые последующие статьи, мы вернёмся к теме альтметрик. Могу лишь удивляться, почему библиотекари не создали систему оценок качества научных публикаций на основе библиотечной статистики книговыдачи. Востребованность книги или журнала читателями ничуть не менее информативна по сравнению с цитированием. Столь же важен анализ спроса и продаж в системе книготорговли.

Несколько упрощая ситуацию, можно сказать, что мотивация цитирования разнообразна, ни к чему не обязывает и зачастую неопределённа, а готовность платить за публикацию имеет прочную основу. Так что новые метрики должны бы учитывать и эти категории.

Что ждёт массовые онлайновые открытые курсы
дистанционного обучения (MOOК) после их взлёта и падения?

Сотрудник известной компании Emerald Саймон Линакр (Simon Linacre) в статье «Разоблачение мифа МООК» (Debunking the MOOC myth) анализирует ситуацию в образовании, возникшую из-за разочарования в массовых онлайновых открытых курсах. Если верить газете «New York Times», 2012 год следовало бы назвать годом МООК (в этом году только по одной специальности – «Искусственный интеллект» – обучалось 150 тыс. человек). Однако, если воспользоваться оригинальной терминологией компании Гартнер (Gartner), в данный момент – в 2015 г. – технология МООК находится на пути от «пика раздутых ожиданий» (2012 г.) к «корыту разочарования» (рис. 4).


Рис. 4. Диаграмма Гартнера (Gartner hype cycle model), отражающая динамику изменения общественной оценки новой технологии, оборудования, явления (основана на экспертных оценках)

Диаграмма Гартнера представляет собой экспертную оценку тех или иных технологий, их «взросления», «возмужания»: как они оцениваются обществом (могут принести скорую и большую прибыль или не очень большую, но надёжную и долговременную, либо вообще оказаться «пустышкой»).

Сейчас же, по мнению С. Линакра, для характеристики среды образования подошёл бы принятый в военной среде и столь же нелепый акроним ВНУД (волатильность, неопределённость, усложнённость, двусмысленность). Конечно, для руководителей университетов проблема состоит не в том, каким словом характеризовать сложившуюся обстановку, а в том, как наладить мосты между народившимися за последние 12 месяцев инновациями в педагогике и многовековыми традициями вузовского академического сообщества.

Создание в 2012 г. системы FutureLearn – единой обучающей платформы по технологии МООК, к которой присоединились 36 британских и международных университетов, а также Британский музей, Британский совет, Британская библиотека, Национальная школа кино и телевидения, – это важный этап модернизации образования. Определённым рубежом развития этой методики можно считать и открытые курсы по компьютерным наукам в Технологическом университете штата Джорджия (стоимость обучения и подготовки к получению степени магистра – 6 600 долларов).

Динамика перемен требует большей гибкости от профессорско-преподавательского состава. Если вузовская система не менялась со времён Древней Греции, ожидать от участников процесса какой-либо готовности к переменам – слишком оптимистично. Например, как показывает изучение статистики пользования МООК, студенты этих курсов наиболее активно занимаются вечером по воскресеньям, что совершенно неприемлемо для большей части профессоров.

Следует указать и на огромные возможности для библиотек – служить центрами знаний для МООК, и на неизбежный процесс глобализации высшей школы. МООК предлагают обучать колоссальное количество людей, у которых не будет проблем, обусловленных переездами и обустройством на новом месте проживания.

Ключевое условие функционирования МООК – это сотрудничество на всех уровнях.

Светлое будущее облачных библиотечных технологий

Шиан Харрис (Sian Harris) в своей статье рассказывает о том, каким образом развитие облачных технологий может быть полезным для научных библиотек. Термин облачные технологии сегодня используется слишком часто и уже довольно затёрт, хотя ещё в 2012 г. в обзоре компании Citrix отмечалось: 51% опрошенных верили в то, что плохая погода влияет на эффективность облачных вычислений.

Извинившись перед достаточно просвещёнными читателями, я всё же дам краткую вводную справку. Несколько упрощая, можно сказать, что облачные технологии – это диалектический второй виток от архитектуры специализированных вычислительных центров (ВЦ, ГВЦ, ГИВЦ), характерной для 1960–1980-х гг. В те годы вся работа с компьютерами (численное решение уравнений, компьютерное симулирование и моделирование, поддержка баз данных и электронных каталогов и т.п.) выполнялась в центрах. Центры обычно имели несколько иерархических уровней, а также специальные устройства ввода–вывода, памяти, печати и т.д.

С приходом персональных компьютеров и серверов ситуация изменилась, и сейчас значительная часть вычислений и доступ к ресурсам выполняются непосредственно на рабочем столе или через систему доступа к вычислительным мощностям. Хотя выполнение каких-то задач сторонними организациями никогда не исчезало (недаром закрепился термин аутсорсинг как символ эффективности) ситуация с использованием компьютерных мощностей стала меняться только в конце 1990-х гг.

Важным шагом к концептуализации облачных вычислений считается предоставление услуг по доступу к вычислительным ресурсам книжным магазином Amazon.com (2002). Развитие сервисов Amazon, фактически превратившегося благодаря этим услугам в технологическую компанию, привело к формулировке идеи вычислительной эластичности и запуску в авг. 2006 г. проекта под названием Elastic Computing Cloud.

Практически одновременно термины cloud и cloud computing прозвучали в одном из выступлений главы Google Эрика Шмидта. Начиная с этого времени облачные вычисления стали упоминаться в СМИ, научно-исследовательской среде.

Отсылка к «облаку» основана на изображении интернета на диаграмме компьютерной сети или как образ сложной инфраструктуры, за которой скрываются все технические детали.

В 2011 г. Национальным институтом стандартов и технологий США зафиксированы следующие обязательные характеристики облачных вычислений:
самообслуживание по требованию (self service on demand) – потребитель самостоятельно определяет и изменяет вычислительные потребности, такие как серверное время, скорость доступа и обработки данных, объём хранимых данных, без взаимодействия с представителем поставщика услуг;
универсальный доступ по сети – услуги доступны потребителям по сети передачи данных вне зависимости от используемого терминального устройства;
объединение ресурсов (resource pooling) – поставщик услуг объединяет ресурсы для обслуживания большого числа потребителей в единый пул для динамического перераспределения мощностей между потребителями в условиях постоянного изменения спроса на мощности; при этом потребители контролируют только основные параметры услуги (например, объём данных, скорость доступа), фактическое распределение ресурсов, предоставляемых потребителю, осуществляет поставщик;
эластичность – услуги могут быть предоставлены, расширены, сужены в любой момент времени, без дополнительных издержек на взаимодействие с поставщиком, как правило, в автоматическом режиме;
учёт потребления – поставщик услуг автоматически исчисляет потреблённые ресурсы на определённом уровне абстракции (например, объём хранимых данных, пропускная способность, количество пользователей и транзакций) и на основе этих данных оценивает объём предоставленных потребителям услуг.

С точки зрения поставщика, благодаря объединению ресурсов и непостоянному характеру потребления, облачные вычисления позволяют использовать меньшие аппаратные ресурсы по сравнению с теми, которые требовались бы при выделенных аппаратных мощностях для каждого потребителя; существенно снижаются затраты на абонентское обслуживание.

С точки зрения потребителя, эти характеристики позволяют получить услуги с высоким уровнем доступности и низкими рисками неработоспособности; благодаря эластичности обеспечить быстрое масштабирование вычислительной системы без необходимости создания, обслуживания и модернизации собственной инфраструктуры.

Существуют три модели обслуживания облачных вычислений:
программное обеспечение как услуга (SaaS, Software as a Service) – потребителю предоставляются программные средства – приложения провайдера, выполняемые на облачной инфраструктуре;
платформа как услуга (PaaS, Platform as a Service) – предоставляются средства для развёртывания на облачной инфраструктуре создаваемых или приобретаемых потребителем приложений, которые разрабатываются с использованием поддерживаемых провайдером инструментов и языков программирования;
инфраструктура как услуга (IaaS, Infrastructure as a Service) – потребитель получает средства обработки данных, хранения, сетей и других базовых вычислительных ресурсов, на которых он может развёртывать и выполнять произвольное программное обеспечение, включая операционные системы и приложения.

Сколько всё это стоит? Стоимость Google Apps для бизнеса – 5 долларов за одного пользователя в месяц с бесплатным пространством на облачном диске 5 Гб (при желании можно докупить ещё от 20 Гб до 16 Тб). Пользователем считается один электронный ящик.

Компания Microsoft делает акцент на комплексное CRM-решение, для приобретения системы Office 365 предлагается несколько вариантов: от 250 до 750 р. в месяц с пользователя.

В 2014 г. суммарные затраты организаций на инфраструктуру и услуги, связанные с облачными вычислениями, оценивались почти в 175 млрд долларов (Louis Columbus. Roundup Of Cloud Computing Forecasts And Market Estimates, 2014 Forbes Tech). Эксперты прогнозируют, что к 2020 г. этот показатель достигнет 240 млрд долларов. Россия по внедрению cloud computing в бизнес занимает 34-е место с показателем 250 млн долларов.

Многие производители систем автоматизации библиотек считают, что у облачных технологий в библиотечном деле – большое будущее. Не всегда сотрудники научных библиотек понимают, что сами исследования, публикация их результатов, системы обнаружения документов и доступа к ним, системы наукометрии – всё это уже сейчас базируется на облачных технологиях. Наиболее ярким примером может служить система WorldCat компании OCLC.

«Во всё большей степени все сервисы управления библиотекарей перемещаются в «облако», – считает Джейн Бэрк (Jane Burke), вице-президент по развитию рынка компании ProQuest. – Эти системы должны реализовать полный спектр работы с фондами, если мы собираемся заменить ими локальные системы автоматизации».

Потенциальная выгода для библиотек при использовании «облаков» включает в себя повышение эффективности работы, отличные возможности для сотрудничества, упрощение требований к части библиотечного персонала, сокращение затрат, своевременное обновление программного обеспечения и совершенствование в целом технологии библиотечной работы, в первую очередь за счёт объединения технологий работы с печатными и электронными ресурсами.

Весьма многообещающим выглядит формирование единой централизованной базы знаний для работы определителя гиперсвязей. Нельзя забывать и о том, что библиотеки смогут переадресовывать средства, расходуемые ранее на поддержание инфраструктуры, на непосредственные нужды пользователей. Работа «в облаках» снимает с библиотекарей многие заботы, перекладывая их на внешних специалистов.

Исполнительный директор по сетевым библиотечным сервисам компании OCLC Эндрю Пейс (Andrew Pace) полагает: «Наибольшую пользу библиотекам принесёт не просто перенос стандартных систем управления и размещение их в «облаке», а, скорее, переход на многопользовательское программное обеспечение, причём системы должны создаваться заново, с нуля, с применением архитектуры XXI века. Вновь созданная система будет обеспечивать большую гибкость в развитии и адаптации к инновациям».

Облачные технологии подвергаются и определённой критике, в основном из-за того, что при использовании виртуального программного обеспечения информация автоматически попадает в руки его разработчика. Так утверждает Ричард Столлман (Richard Stallman), основатель движения открытого ПО. Выделяется проблема интеграции данных как с внутренними корпоративными, так и с облачными сервисами других поставщиков. Эксперты указывают на проблему неконтролируемых данных: информация, оставленная пользователем, будет храниться годами, причём без его ведома, и он не сможет изменить какую-либо её часть. К примеру, на сервисах Google пользователь не в состоянии удалить не использованные им сервисы и даже отдельные группы данных.

Мои комментарии:

1. Препятствием на пути в «облака» является «врождённая» осторожность библиотечных работников, обязанных обеспечивать целостность огромных и дорогостоящих фондов (хотя трудно представить себе злоумышленника, который бы покушался на общедоступные коллекции публичных или вузовских библиотек). Однако, как справедливо отмечает Лиз Ван Халсема (Liz Van Halsema) из компании SirsiDynix: «В зависимости от своего типа, у библиотек могут быть определённые ограничения на работу в “облаках”. Правительственные, военные и другие особые типы библиотек, например, не могут хранить определённые виды данных вне своих организаций. И напротив, публичные и вузовские библиотеки стремятся стать полноправными пользователями облачных технологий».

2. Замечание общего плана, касающееся информационной безопасности: доступ в «облако» – это улица с двусторонним движением. Каждое ваше обращение к «облаку» открывает дорогу для тех, кому по каким-либо причинам хочется узнать, что пишут вам по электронной почте, в каких совещаниях и с какой повесткой дня вы участвовали, кто там был ещё, какие отчёты вы подготовили или прочитали за последнее время и т.д. Поэтому, задаваясь самым будничным, незатейливым вопросом вроде «Какая погода сейчас на Лазурном берегу?» или «Прибыл ли утренний рейс SU 231 в аэропорт Хитроу?», полезно помнить, что все подобные данные уже находятся в «облаках» и, ожидая ответа, вы, возможно, открываете содержимое своего компьютера, а также компьютеров всех, с кем вы общаетесь, любому заинтересованному лицу или организации.

Развитие альтметрик

Вильям Ганн (William Gunn), руководитель направления альтметрик компании Mendeley, которая систематизирует и обеспечивает хранение личных научных коллекций в сети, делится впечатлениями от конференции Общества научных издателей (Society for Scholar Publishing), прошедшей 28–30 мая 2014 г. в Бостоне (США), где он провёл одно из заседаний.

В обсуждении на конференции принял участие Тодд Карпентер (Todd Carpenter), директор NISO – Национальной организации стандартов (США), которая завершает первый этап работы над соответствующим стандартом.

В ходе обсуждения были сформулированы наиболее важные вопросы и намечены пути исследований NISO на следующем этапе разработки стандарта.

Данные обзора авторов, публикующихся в компании «Elsevier», сообщил представитель системы Scopus Майкл Хабиб (Michael Habib). Общая осведомлённость авторов о различных версиях альтметрик пока ещё очень невысока по сравнению с их знанием систем, основанных на величине импакт-фактора журнала; однако просвещение продвигается быстро.

Учредитель компании «Altmetrics» Юн Ади (Euan Adie) рассказал о полезности новых средств для различных групп – издателей, авторов, грантодателей.

Ещё одно обсуждение проблем альтметрик было проведено в ходе конференции Ассоциации издателей журналов научных и профессиональных сообществ (Association of Learned and Professional Society Publishers) (10–12 сент. 2014 г., Хитроу, близ Лондона).

На конференции прозвучала обеспокоенность издателей журналов ОД, связанная с тем, что применение концепции импакт-фактора к оценке заново созданных журналов ставит их в заведомо невыгодное положение – у таких журналов просто не было времени набрать достаточно весомое количество цитирований. Тем не менее, в оценках исследований и принятии решения о дальнейшем финансировании импакт-фактор журналов (Journal Impact Factor, JIF) служит маяком. Особенно это характерно для КНР и стран Восточной Азии.

Как отметил Юн Ади: «Слово альтметрика – неправильное; оно подразумевает замену». А на деле речь не идёт о выборе между технологией цитирования и позицией социальных сетей и СМИ. «Цитирование всегда будет отличным индикатором научной активности; собраны великолепные наборы данных, и JIF – хороший показатель. Просто не следует полагаться исключительно на него. Проблемы возникают, когда JIF становится самоцелью».

С такой позицией солидарна и вице-президент компании «Thomson Reuters» Патриция Бреннан (Patricia Brennan): «Импакт-фактор, в частности JIF, насчитывает много-много лет, широко используется и вполне годится для оценки журналов … Но нам нужен целый набор измерительных средств и способов для замеров всех видов научной активности. Если вы ведёте измерения на уровне статьи, вам необходимы соответствующие инструменты. Если вы пытаетесь оценить активность отдельных учёных, разумно делать это на их поле деятельности… Не существует подходящих для всех случаев метрик и инструментов. Наша система Journal Citation Report – JCR – использует целый набор методик». Совсем недавно компания «Thomson Reuters» включила подробную информацию из JCR в состав платформы InCites, которая помогает анализировать результативность научных исследований.

Конечно, судьба альтметрик в значительной мере будет зависеть от позиции самих учёных, грантодателей, руководства университетов. Пока что, как отмечает Юн Ади, «наблюдается очень слабая корреляция между цитированием и альметриками. Полезную роль могут сыграть новые стандарты. Мы знаем, что некоторые альтернативные метрики больше подходят для науки, какие-то имеют отношение к политике, а другие – к широкой публике». У любых средств есть как сильные, так и слабые стороны. Хорошо известна порочная практика искажения традиционного импакт-фактора за счёт искусственного «раздувания» своего журнала или своей статьи; но ведь то же самое можно делать и с гиперссылками!

Патриция Бреннан отмечает: «К сожалению, в любой системе есть тенденция к нечестной игре. Мы считаем, что ключом здесь должно быть воспитание». Сложная картина многих метрик и значимость их использования породили новую опасность – создание фиктивных результатов метрик. Американский библиотекарь и блоггер Джеффри Билл (Jeffrey Beall) пишет о сомнительных журналах, которые приводят цифры, похожие на те, что демонстрирует «Thomson Reuters», но являются фальшивкой. «Конечно, это очень печально и очень тревожит нас, в особенности тех, кто стал жертвой обмана, – комментирует П. Бреннан. – И снова я говорю о важности воспитательной работы и работы с общедоступным списком журналов, которые мы обрабатываем. Всё это так или иначе обусловлено колоссальным ростом количества журналов».

Ещё одна сложность связана с тем, что альтметрики введены совсем недавно, как и соответствующие инструменты. Например, Twitter тоже создан совсем недавно и очень быстро растёт, так что результаты оценок сильно зависят от года публикации.

Как можно прокомментировать эти дискуссии?

Во-первых, неизбежная и естественная разница во времени, в оперативности появления первых цитирований по сравнению с мгновенными отзывами на сетевые публикации. Мы уже рассказывали в нашем журнале о разнице в динамике цитирования публикаций и их выгрузке* (* Земсков А. И. Библиометрия: взгляд на проблему. Сравнение уровня цитирования научных статей в разных странах. – Науч. и техн. б-ки. – 2014. – № 9. – С. 37, 38, 42.); здравый смысл подсказывает: для того чтобы кого-либо цитировать, надо ещё написать свою статью, в которую цитирование будет включено.

Во-вторых, российским исследователям пока «не до того»: поставленная задача – достигнуть доли в 2,44% от общего уровня мировых научных публикаций – всё ещё далека от решения. А то, что 87% статей российских учёных вообще ни разу не цитируется,** (** Там же. – С. 31.) – особенно важная проблема, требующая специального рассмотрения.

И в-третьих, отсутствие корреляции между показателями, полученными традиционными средствами, с показаниями, полученными альтметриками, с большой вероятностью может объясняться неадекватностью инструментария. Но не исключена и более тревожная истина – все виды отзывов о научной работе (как библиометрия, так и альтметрики) никак не связаны с её качеством и подчиняются закону случайных чисел. Тогда всё здание современного управления наукой окажется в зоне деформации.