ИНФОРМАЦИОННЫЕ
ТЕХНОЛОГИИ В БИБЛИОТЕКАХ
УДК 025:65.011.56
М. В. Гончаров, К. А. Колосов
Развитие Интернет-комплекса ГПНТБ России
в меняющихся условиях
Представлена структура Интернет-комплекса ГПНТБ России, в том числе
новая технология поддержки электронной почты.
Модернизация Интернет-комплекса
ГПНТБ России
Динамика развития современных информационных технологий такова,
что модернизация системы Интернет-комплекса крупной библиотеки становится
непрерывным процессом, и сегодня невозможно себе представить ситуацию, когда
можно было бы сказать, что библиотека полностью закончила переход на тот уровень технического и программного обеспечения,
который полностью обеспечивал бы поддержку всех ее проектов и задач.
ГПНТБ России стремится соответствовать самым высоким требованиям к
техническому и программному обеспечению современных библиотечных
Интернет-комплексов и проводит постоянную модернизацию системы
телекоммуникационного доступа, Интернет-серверов и программного
обеспечения.
Структура Интернет-комплекса ГПНТБ России на начало 2009 г.:
сервер маршрутизации, защиты доступа (Firewall) и анализа сетевого трафика –
платформа Linux;
сервер доменных имен DNS и сервер приложений на платформе Linux;
веб-сервер портала ГПНТБ России, сервер Z39.50 на платформе Windows;
сервер приложений WEB-ИРБИС,
сервер порталов Корпоративной сети московских библиотек и Научной электронной
библиотеки ГПНТБ России (НЭБ ГПНТБ) на платформе Windows;
сервер электронной почты, хранения и подготовки документов НЭБ
ГПНТБ на платформе Windows;
веб-сервер, сервер приложений
защищенного просмотра документов DefView,
сервер хранения документов Image-каталога
на платформе Windows.
Основу аппаратного обеспечения Интернет-комплекса ГПНТБ России,
использующего его Windows-платформу,
составляет кластер серверов DellPowerEdge.
Серверы Dell™ PowerEdge™ рассчитаны на корпоративных заказчиков, которым нужны высоконадежные,
легкие в управлении и обслуживании системы для работы в сетевом окружении.
Использование только
проверенных стандартизованных технологий способствует обеспечению надежности
решений и снижению общей стоимости владения, а сервисная поддержка резко
сокращает общие расходы на эксплуатацию техники. Серия включает как
высокопроизводительные серверы с широким набором функциональных возможностей,
так и экономичные модели серверов, рассчитанные на выполнение широкого круга
задач, таких как консолидация вычислительных ресурсов предприятия, поддержка инфраструктуры
сети internet/intranet, создание высокопроизводительных
отказоустойчивых кластерных систем и т.д.
Базовая модель этой серии
последних лет – сервер девятого поколения PowerEdge 2950. Сервер построен с использованием самых
современных технологий: интерфейс жестких дисков SAS; поддерживает технологию
двухядерных процессоров, частоту оперативной памяти 667 МГц, частоту FSB до
1333 МГц, работу в сети хранения данных (SAN) и кластеризацию. Приведенные
технические характеристики показывают, что эта модель особенно эффективна для
использования в качестве сервера приложений, баз данных, а также в качестве
многозадачного сервера.
Постоянно ведутся работы по дальнейшему наполнению и актуализации
всего информационного массива Интернет-комплекса ГПНТБ России. В частности, в
2008 г. закончен перевод веб-сайта ГПНТБ России на систему управления
контентом на основе CMSJoomla. В результате значительно возросла оперативность
обновления и актуализации информации на сайте. Реализован новый вариант
англоязычной версии сайта с использованием CMSJoomla, а также подключена лента новостей на основе технологии RSSи
языка XML.
В 2008 г. ГПНТБ России стала участником проекта Национальной
электронной библиотеки. В связи с этим существенным образом доработано программное
обеспечение НЭБ ГПНТБ.
Для повышения надежности гиперссылок на полнотекстовые ресурсы и
решения задачи разграничения доступа к ресурсам НЭБ различным группам
пользователей разработана и внедрена оригинальная технология PersistentUniformResourceLocator (PURL).
В отличие от URL
технология PURL
использует в качестве адреса не прямой интернет-адрес ресурса, а адрес
промежуточной программы переадресации, которой в качестве параметра передается
уникальный идентификатор ресурса. Это значительно упрощает перемещение ресурсов
на серверах, где они хранятся, так как не требует отслеживания и корректировки всех гиперссылок на перемещаемый ресурс. Кроме
того, за счет анализаадреса клиента,
запросившего ресурс, может изменяться режим доступа к нему.
Важное значение для оценки эффективности функционирования Интернет-комплекса
имеет анализ статистики.
В ГПНТБ России функционирует система автоматизированного сбора
статистики и анализа трафика всего Интернет-комплекса. В 2008 г. значительно
возросло число посещений сайта библиотеки (1 050 188
– в 2008 г., 856 972 – в 2007 г.); наблюдается тенденция роста
интенсивности работы постоянных посетителей и
увеличения объема получаемой ими информации: передано 126 Гбайт данных (106
Гбайт – в 2007 г.).
Ежедневно сайт ГПНТБ России посещают
от 2000 до 3500 пользователей. Наиболее загруженные периоды – март – май,
ноябрь – декабрь, что подтверждает вывод о большом числе учащихся в общем
потоке посетителей сайта.
Анализ внешней статистики использования сервера ГПНТБ России
позволяет сделать вывод о том, что сервер является одним из лидеров в разделах
научных сайтов внешних агентов. Например, в индексе цитирования Яндекса ГПНТБ
России уверенно занимает второе место среди библиотек, уступив в текущем году
только РГБ.
Новая технология поддержки
электронной почты
в ГПНТБ России
В январе 2009 г. в ГПНТБ России установлено новое программное
обеспечение поддержки электронной почты MerakICEWarp. Основные причины смены предыдущего программного
решения: спам стал превышать объем полезной переписки; потребность в безопасном
удаленном доступе к рабочей почте через веб-браузер; необходимость удобного
администрирования и управления сервером.
Среди перечисленных причин проблема возросшего спама явилась
наиболее существенной. Еще в 2003 г. спам в России вышел на общемировые
показатели и составлял, по мнению провайдеров, более 25%, а по оценке интернет-компаний,
– около 50% общего трафика электронной почты (http://www.microsoft.com/Rus/ Government/Newsletters/Issue23/05.mspx).
В марте 2008 г., по данным члена Общественной палаты адвоката
Павла Астахова, 90,7% почтового трафика российского Интернета составил спам. В
Интернете стало появляться огромное количество писем, содержащих порнографию
или материалы экстремистского характера.
Последние данные антивирусной компании «Sophos»: ежедневно в
Интернете спамеры создают более 23 тыс. сайтов, т.е. каждые 3 секунды
появляется их новый сайт; из каждых 100 электронных писем, отправляемых через
Интернет, 92,3 – спам. Как и прежде, самые активные спамеры – США и Россия,
однако по сравнению с предыдущими данными обе страны чуть уменьшили свои доли в
общей копилке спама. Для России ситуация выглядит особенно тревожной, так как
всего за год доля страны в спаме выросла почти вдвое, и РФ обогнала по этому
показателю КНР (http://www.itsec.ru/newstext.php?news_id=44134).
После анализа современных программных решений поддержки электронной
почты специалисты ГПНТБ России остановили выбор на серверном решении MerakICEWarp. Почтовый сервер MerakICEWarp установлен более чем
в 80 тыс. организаций во всем мире и характеризуется высокой функциональностью.
Сервер позволяет совершать обмен электронной корреспонденцией, надежен и удобен в администрировании. Веб-почта позволяет
пользователю подключиться к своему почтовому ящику из любой точки интернет-доступа,
облегчает настройку и обучение модуля анти-спама, предоставляет возможность
удаленного администрирования почтового сервера.
Стандартный модуль Антиспам включает в себя более 20 технологий
распознавания и отсеивания спама, содержит функции «белый список», «черный
список» и является интеллектуальной системой. Структура модулей сервера ICEWarp представлена на
рисунке.
Потенциал функциональных возможностей данного сервера весьма
высок, что явилось основным аргументом в пользу выбора именно этого
программного продукта для обновления службы электронной почты ГПНТБ России.
Структура модулей сервера ICEWarp
В современных информационных системах особое внимание уделяется
вопросам защиты и безопасности информации. Роль этих вопросов еще более
возрастает, если доступ к конфиденциальной информации, к которой относится
электронная почта, возможен с использованием веб-браузера.
Разработчики сервера ICEWarp предусмотрели большой набор программных решений для
обеспечения защиты информации. При передаче пароля, подтверждающего
идентификацию пользователя при обращении к серверу через веб-интерфейс,
используются открытый ключ RSA, асимметричные шифровальные методы, а также
SSL-шифрование трафика для предотвращения перехвата и изменения информации.
Сообщения могут быть подписаны с помощью общественно-частной
ключевой комбинации точно так же, как в широко известной системе шифрования
PGP, не требуя дополнительного ПО от почтового клиента. Исходящие электронные
письма могут быть проверены антивирусом, антиспамом, а также ограничены
ежедневными объемами электронной почты, что позволяет предотвратить случаи
массовой рассылки спама при несанкционированном проникновении в систему
посторонних лиц, использующих взлом слабых паролей.
Разумеется, предусмотрены многочисленные встроенные средства для
анализа состояния системы и сбора статистики, позволяющие системному
администратору выявлять подозрительные ситуации и попытки несанкционированного
проникновения в систему.
Отправление оптовых количеств
электронной почты может быть эффективно предотвращено политикой контроля
протокола и контроля сессии. В частности, могут быть использованы следующие
технические приемы:
тайм-аут пассивной сессии,
задержка ответа протокола,
максимум неверных команд,
максимум запросов неподтвержденных подключений,
выполнение задержки перед входящим SMTP-подключением.
Так называемые Phishing-атаки основаны
на применении подделки заголовков сообщений с использованием фальшивых имен
отправителей. Для предотвращения подобных действий предусмотрена проверка DNS с целью подтверждения
достоверности отправляющего почтового сервера.
Система предотвращения вторжений позволяет контролировать попытки
доставить сообщения несуществующим пользователям, временно блокируя IP-адреса
отправителей, превысивших количество ошибочных подключений.
Административный интерфейс сервера обеспечивает возможность
управления списком блокированных IP-адресов, отображает причины блокировки IP.
Такое решение является эффективным средством борьбы со спамом и противодействия
DoS-атакам, использующим
метод «заваливания» сервера электронными письмами с целью выведения его из
рабочего состояния из-за превышения доступных ресурсов памяти и мощности процессора.
Предусмотрено три режима доступа к электронной почте:
с рабочих мест пользователей ГПНТБ России с использованием программы
почтового клиента;
из внутренней сети ГПНТБ России через веб-браузер для просмотра
писем, попавших в папки “Спам” и “Карантин”, управления списками ("Белый
список" проверенных отправителей, "Черный список" – спамовый список)
и для доступа к календарю;
из сети Интернет через
веб-браузер с использованием защищенного протокола HTTPS для возможности удаленной работы с электронной почтой.
С внедрением нового почтового сервера сотрудники ГПНТБ России
получили возможности доступа к электронной почте в локальном и удаленном
режимах, управления списками фильтрации нежелательных писем, работы с
корпоративным календарем, использования современного протокола IMAP.
|