СЕТЕВЫЕ ТЕХНОЛОГИИ
УДК 681.612.94
Шрифты STIX
и система обозначений Latex
–
инструменты для использования в сетевых
публикациях
С первых дней работы по
подготовке к публикации в сети материалов
по науке, технике и медицине издатели
столкнулись с серьезными проблемами, им
пришлось идти на компромисс между
функциональностью и качеством публикации.
При стремлении сохранить
высокое качество воспроизведения текста
или формул единственным выбором для
издателя было использование формата .Portable Document
Format
pdf. При этом, однако, выступали
некоторые негативные особенности и
терялись многие
функциональные достоинства формата HTML, например, возможность
формирования внутренних и внешних
гиперссылок, навигация по документу,
применение мультимедийных вставок и т.д.
Эксперименты по расширению
функциональности формата HTML
не были особенно удачными, поскольку в
распоряжении издателей был сравнительно
ограниченный набор шрифтов, которые
поддерживались клиентскими браузерами (за
исключением самых новых), и неспособность
формата HTML воспроизводить качественно
математические уравнения и формулы.
Для решения этих проблем в 1994 г.
собралась достаточно неформальная группа
издателей (STI
pub.), состоящая в основном из
представителей Американского химического
общества, Американского института физики,
Американского математического общества,
издательств Elsevier
и IIII.
Эта группа идентифицировала
около 4 тыс. знаков, для передачи которых
требовалось примерно 7 700 глифов (все это
охватывало потребности широкого круга
научных дисциплин – от наук о жизни до
физики). Здесь под словом знак
подразумевается уникальная кодировка
буквы или символа, например, строчная «а»
соответствует цифре 97. Глиф
– конкретное написание данного знака,
например, для строчной «а» имеются варианты:
а (обычное прямое написание); а
(жирный шрифт); а (курсив);
а (жирный
курсив).
Для печатных изданий
воспроизведение всех этих символов не
представляет сложностей и давно освоено, то
же самое можно сказать и о формате
электронного документа .pdf,
однако для формата HTML
такая свобода практически недостижима.
Поэтому каждый издатель, работающий со
специальными знаками, вынужден вставлять
их как графические образы в текст формата HTML.
Как и другие образцы графики,
содержащиеся на сетевой странице, выгрузка
такой вставки будет производиться отдельно
по командам языка разметки (тэгов). Если
таких вставок окажется много, выгрузка
существенно затянется.
Еще одна проблема заключается в
том, что графика строится и фиксируется с
определенным размером знаков. Если
пользователь пожелает изменить размер букв
в том тексте, которым он сейчас пользуется,
то графическое изображение, конечно, не
изменится, а это значит, что расположение
формулы на строке может «поплыть» и сама
формула или уравнение станут
трудночитаемыми.
В 1995 г. STI
pub. приступила к разработке серии
сетевых шрифтов, которую они назвали «обмен
научно-технической информацией» (Scientific
and
Technical Information
eXchange,
STIX).
Огромную роль в успешной реализации этого
проекта сыграло принятие стандарта UNICODE.
Многие из уникальных, специальных знаков
системы STIX
включены в версию UNICODE
3.2, выпущенную в 2002 г. Дальнейшее развитие и
воплощение идеология системы STIX
получила при разработке стандарта eXtensible Markup
Language
XML, в который кодировка UNICODE включена изначально.
Еще один позитивный этап –
разработка языка математической разметки Math
Markup Language, Math ML,
использование которого позволяет
сохранить правильное написание формулы или
уравнения на строке.
Предполагается, что по
завершении разработки системы шрифтов STIX, ее можно будет получить на веб-сайте
www.stixfonts.org.
Latex.
По тем же причинам, что вызвали к жизни
разработку системы STIX,
создан Latex (произносится как Латех).
AMS-Latex
представляет собой разработанный
Дональдом Кнутом (Donald
E.
Knut) и
принятый Американским математическим
обществом развернутый свод правил по
представлению математических формул и
уравнений любой сложности (алгебраических,
дифференциальных, дифференциальных в
частных производных, интегральных и т.п.),
матриц и коммутативных соотношений в виде
однострочных (т. е. высотой в одну строку)
выражений. Например, для формулы энтропии Шеннона,
доступной для воспроизведения благодаря
довольно новой версии текстового редактора
Word,
запись в формате Latex
выглядит как
где все символы «стоят в ряд».
Точно так же, в один ряд, можно записать в
наборе Latex
и намного более сложные выражения.
Земсков А.И.
|