For faster navigation, this Iframe is preloading the Wikiwand page for DjVu.

DjVu

Материал из Википедии — свободной энциклопедии

DjVu
Изображение логотипа
Расширение .djvu[3] или .djv[3]
MIME-тип image/vnd.djvu
image/x-djvu
Сигнатура AT&TFORM
Разработчик AT&T Labs-Research, LizardTech (с марта 2000[1])
Опубликован 1998
Последний выпуск 27 (июль 2006[2])
Тип формата Электронный документ
Открытый формат? Да
Сайт djvu.org (англ.)
Логотип Викисклада Медиафайлы на Викискладе

DjVu (от фр. déjà vu — «уже виденное») — технология представления и хранения документов (книг, журналов, рукописей и подобных, прежде всего сканированных) с использованием сжатия изображений с потерями.

Изначально технология была разработана Яном Лекуном, Леоном Боту и Патриком Хеффнером в AT&T Labs с 1996 по 2001 годы.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.

Используемые технологии

[править | править код]

Для сжатия цветных изображений в DjVu применяется специальная технология, разделяющая исходное изображение на три слоя: передний план, задний план и чёрно-белую (однобитовую) маску. Маска сохраняется с разрешением исходного файла; именно она содержит изображение текста и прочие чёткие детали. Разрешение заднего плана, в котором остаются иллюстрации и текстура страницы, по умолчанию понижается для экономии места. Передний план содержит цветовую информацию о маске; его разрешение обычно понижается ещё сильнее. Затем задний и передний планы сжимаются с помощью вейвлет-преобразования, а маска — алгоритмом JB2.

Особенностью алгоритма JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. В многостраничных документах каждые несколько подряд идущих страниц пользуются общим «словарём» изображений.

Для сжатия большинства книг можно обойтись только двумя цветами. В этом случае используется всего один слой, что позволяет достичь рекордной степени сжатия. В типичной книге с чёрно-белыми иллюстрациями, отсканированной с разрешением 600 dpi, средний размер страницы составляет около 15 Кб, то есть приблизительно в 100 раз меньше, чем исходный файл. В присутствии сложного заднего плана выигрыш объёма составляет обычно 4—10 раз. Однако при стандартных настройках в DjVu используется сжатие данных с потерями, поэтому для особо важных документов обычно используются форматы сжатия без потерь: PNG, JPEG 2000, TIFF и т. п. Например, сжатие без потерь предоставляет утилита CJB2 из пакета DjVuLibre.

В основе формата DjVu лежат несколько технологий, в том числе разработанных в AT&T Labs:

  • алгоритм отделения текста от фона на отсканированном изображении;
  • вейвлетный алгоритм сжатия фона IW44;
  • алгоритм сжатия чёрно-белых изображений JB2 (похожий на JBIG2);
  • универсальный алгоритм сжатия BZZ (похожий на BZIP2);
  • алгоритм распаковки «по запросу»;
  • алгоритм «маскировки» изображений.

Текстовое представление изображений DjVu

[править | править код]

Формат DjVu предусматривает наличие текстового слоя, который содержит текст со страницы (используется для поиска и лёгкого копирования текста при работе с ним). В случае, если текстовый слой недоступен, единственный метод получения текста — выполнение оптического распознавания в сторонних программах.

Лицензионная информация

[править | править код]

В марте 2000 года[1] AT&T продали технологию компании LizardTech[4], которая пыталась использовать её в своих коммерческих интересах, но благодаря открытости формата[5] для создания и просмотра документов DjVu существует свободное программное обеспечение, доступное для различных платформ. 1 июля 2008 года LizardTech передал менеджмент DjVu родительской компании Celartem[6], а 10 июня 2009 года Celartem передал права на технологию DjVu компании Cuminas (ранее Caminova[7])[8].

Существует открытая публикуемая под лицензией GNU GPL библиотека DjVuLibre и программы-кодировщики и просмотрщики на ней.

Примечания

[править | править код]
  1. 1 2 См. файл readme пакета DjVuLibre-3.5.27.tar.gz
  2. DjVu File Format Versions. Разработчики DjVu (июль 2006). Дата обращения: 16 января 2010. Архивировано 13 июня 2010 года.
  3. 1 2 TrID — 2003.
  4. DjVuLibre History and Credits Архивная копия от 9 сентября 2017 на Wayback Machine (англ.)
  5. Лицензия. Дата обращения: 28 мая 2009. Архивировано 2 мая 2009 года.
  6. Пресс-релиз LizardTech. Дата обращения: 4 октября 2008. Архивировано из оригинала 28 сентября 2008 года.
  7. Caminova — Cuminas transition. Дата обращения: 25 октября 2014. Архивировано из оригинала 5 октября 2014 года.
  8. Пресс-релиз LizardTech. Дата обращения: 17 июля 2009. Архивировано из оригинала 16 июля 2009 года.
{{bottomLinkPreText}} {{bottomLinkText}}
DjVu
Listen to this article

This browser is not supported by Wikiwand :(
Wikiwand requires a browser with modern capabilities in order to provide you with the best reading experience.
Please download and use one of the following browsers:

This article was just edited, click to reload
This article has been deleted on Wikipedia (Why?)

Back to homepage

Please click Add in the dialog above
Please click Allow in the top-left corner,
then click Install Now in the dialog
Please click Open in the download dialog,
then click Install
Please click the "Downloads" icon in the Safari toolbar, open the first download in the list,
then click Install
{{::$root.activation.text}}

Install Wikiwand

Install on Chrome Install on Firefox
Don't forget to rate us

Tell your friends about Wikiwand!

Gmail Facebook Twitter Link

Enjoying Wikiwand?

Tell your friends and spread the love:
Share on Gmail Share on Facebook Share on Twitter Share on Buffer

Our magic isn't perfect

You can help our automatic cover photo selection by reporting an unsuitable photo.

This photo is visually disturbing This photo is not a good choice

Thank you for helping!


Your input will affect cover photo selection, along with input from other users.

X

Get ready for Wikiwand 2.0 🎉! the new version arrives on September 1st! Don't want to wait?