Форум

Использование формата DjVu для публикации документов на сайте.

spack: Сведения о DjVu формате DjVu - графический формат, оптимизированный для хранения отсканированных документов, идеально подходит для создания электронных книг. Известны два традиционных способа хранения отсканированной книги: 1) распознавание (OCR) с последующей подготовкой полнотекстового электронного документа, и 2) использование непосредственно отсканированных картинок, собранных затем в pdf документ. В первом случае необходимо провести огромный объем работ, во втором - получаются файлы размером в десятки и даже сотни мегабайт. Формат DjVu (дежа-вю) позволяет создать из отсканированных картинок электронную книгу без потери качества. Принцип этого формата состоит в том, что текст и контрастные рисунки сохраняются с разрешением 300dpi, а всё остальное считается фоном и сохраняется с низким разрешением. Это позволяет сохранить электронный документ с высокой степенью сжатия без потери его читабельных качеств. В DjVu формате размер файла отсканированной книги во много раз меньше исходных файлов картинок. Например, отсканированная книга Дитц Я. История поволжских немцев-колонистов (496 стр. + 1 стр. с цветной обложкой), сохранённая в формате jpg с максимальной степенью сжатия и разрешением 300dpi, заняла у меня на диске 231 Мб. Сейчас проводится работа по созданию электронной версии книги Якоба Дитца в формате DjVu. Предварительно уже можно сказать, что размер файла электронной книги получится всего лишь 4 Мб. Электронные книги в DjVu формате, в отличие от pdf документов, очень легко и быстро открываются даже в Интернете. В настоящее время формат DjVu становится практическим стандартом для электронных библиотек технической и научной литературы. Файлы с расширением DjVu всё чаще встречаются в сети. * * * Я неслучайно так подробно останавливаюсь на DjVu формате. Дело в том, что уже сегодня я разместил на сайте первый документ в DjVu – это старая газета, издававшаяся в Республике Немцев Поволжья, "Rote Jugend" от 26 октября 1936 г. В планах на будущее – размещение ещё нескольких старых немецких газет, создание электронной библиотеки сайта. Таким образом, всем, кому это интересно, предлагаю поближе познакомиться с форматом DjVu. Программы для работы с форматом DjVu Для работать с файлами DjVu, вам потребуется специальное программное обеспечение. Придётся потратить немного времени и скачать несколько программ. В первую очередь рекомендую установить плагин для браузера IE – позволяет просматривать файлы DjVu в окне браузера (работает с IE, Netscape, Opera). После установки плагина, электронные книги в DjVu формате можно открывать непосредственно в Интернете, без предварительного скачивания файлов на компьютер. Плагин разработан фирмой LizardTech и распространяется свободно. DjVu Browser plugin 6.1 [Скачать плагин 6.47Mb] Другое полезное программное обеспечение для работы с файлами DjVu - это программы-просмотрщики. С их помощью можно просматривать, предварительно скачанные из Интернета, файлы электронных книг в DjVu формате. На сегодняшний день таких программ существует много. Предлагаю одну очень удобную программу, которой пользуюсь сам: WinDjView-0.3.5 [Скачать 494Kb] - Удобная небольшая программа для просмотра djvu-файлов. Скачать можно также здесь.

Ответов - 32, стр: 1 2 All

spack: Nic В PDF тоже нельзя скопировать текст, если в него не подложен распознанный слой. Если нужно процитировать текст, я поступаю следующим образом. Сохраняю нужные страницы как картинки, загоняю в FineReader, распознаю текст и использую его по назначению.

Nic: spack пишет: Сохраняю нужные страницы как картинки PrintScreen с экрана?

russ28: Nic пишет: PrintScreen с экрана? Можно с экрана, а можно выделить и сохранить изображение в самой программе, 7-ой значок на стандартной панели инструментов.


spack: Nic Андрей! Ёлки-палки. Поставь себе FineReader 9.0 (он распознаёт DjVu) и не морочь себе голову.

Nic: russ28 Понятно. Просто в моей WinDjView v. 5.0 сохранить как картинку из файла невозможно.

Nic: spack Вот с этого и нужно было начинать.

spack: Как пытали, так и отвечал. А ежели хочется сохранить из DjVu как картинку, то надо скачать другой вьювер. Тот, который я выложил на сервере, предназначен только для просмотра DjVu.

spack: Друзья! Вы меня немало удивили. Я столько лет выставляю книги в формате DjVu и вы всё это время молчите, что не знаете, что с ними делать?! Почему не подняли этот вопрос в теме "Использование формата DjVu для публикации документов на сайте"? Тема открыта ещё в мае 2007 года специально для обсуждения проблем с этим форматом.

spack: Даю ссылку на очень полезную страницу, на которой можно найти много полезного софта по DjVu: http://djvu-reader.ru/programms.html

sander: Связка ABBYY FineReader (от 8-ки и выше) + ABBYY Screenshot Reader + ABBYY PDF Transformer решает любые проблемы

Svetlaia: Господа, я не могу точно сказать, какие программы у меня стоят. Ещё когда я пришла на форум, мне Александр подсказал что- то скачать и я без проблем обычно скачиваю - появляется окошечко и мне предлагают открыть с помощью или скачать, я скачиваю благополучно и всё. Проблем не было. А сегодня окошечко появляется, а скачать не даёт ((((( Кстати, у меня есть же сохранённые файлы со значком - типа кометы

Nic: spack Да всё нормально с форматом и он очень удобный. Ставить нечто навороченное пока нет смысла. Решил сегодня для себя проблему перевода формата DjVui в PDF малюсенькой утилиткой dopdf.exe, скачав её вот отсюда. Созданный PDF открывается любой версией FineReader'a, например, 7-й. И не нужно её апгрейдить до 9.0. При этом отсутствие у файлов внедренного OCR слоя никакого значения не имеет.



полная версия страницы