fregimus. Не дежавю

Встречаю множество книг, оцифрованных в формате DJVU. Не могу понять, чем так привлекает этот формат. Возможно, для каких-то применений он и хорош, но для книг не годится.

Если книга в PDF, я могу в ней с помощью Акробата расставить иерархические закладки, могу проиндексировать ее для быстрого поиска, могу собирать библиотеки и индексировать их. Windows «заглядывает» в PDF, когда индексирует файлы для текстового поиска. Много еще чего можно делать, но это самое главное, чего мне недостает. Казалось бы, велика беда, но ведь и этого-то нет в стандартной программе для просмотра файлов DJVU! Не говорю о том, насколько неудобна эта программа. Все надо делать мышью (можно, конечно, через Alt в меню ходить, но это тоже неудобно) Если книга без текстового слоя, все, что я могу с ней сделать — полистать. Могу еще через меню выбрать на какую страницу перейти, но этот формат даже нумерацию секций не поддерживает — так что я и по оглавлению не найду нужную страницу! Lose, lose!

Здесь все понятно: много я видал въезжающих на белом коне в занятые кем-то другим ниши, да выглядели они потом бледно. С Акробатом конкурировать сложновато, уж очень он продуман хорошо. Да и LizardTech, как понимаю, забросил это дело и переориентировался с цифровых документов на картографию.

Самое странное, что формат кажется «запертым». Он вроде бы «открытый», но ощущение такое, что не особенно он открытый. Несколько раз пытался найти программы для перекодировки этих файлов в, например, PDF — тщетно. Пытался даже напечатать на виртуальный принтер, но печатается растровый образ страницы. Экспорт — пожалуйста, но по одной странице, и только графика. Утилита для экспорта в PostScript тоже только графику экспортирует. Когда я почитал документацию, оказалось, что, хотя формат сам по себе открытый, кусочки его все-таки засекреченные: компрессия, например, текста. Где-то законные ограничения, где-то кода нет. Дело темное.

Не бывает ли на свете такой программы, чтобы перекодировать DJVU, содержащий текстовый слой, в PDF, не теряя при этом текст и его расположение на текстовом слое?

Flat. Top-Level Comments Only

Posted by

randomisator.livejournal.com

Плюс djvu - то, что он меньше места занимает. При сканировании выигрыш в объёме может оказаться десятикратным. Поэтому для книг его и используют, всё-таки 10 Мб и 100 Мб - рзница ощутимая.

Posted by

fregimus.livejournal.com

У меня нет проблем с местом, где я мог бы хранить столько книг, во сколько я за всю жизнь хотя бы просто загляну. Она не такая длинная, как это поначалу кажется…

Posted by

vadim-i-z.livejournal.com

Есть djvu с текстовым слоем. Это зависит от того, делался ли OCR при перекодировке - как и в pdf, кстати. Для таких файлов есть опция "экспортировать текст", коей я и пользовался неоднократно.
Файлу djvu легко присобачить многоуровневое оглавление, оно же иерархические закладки. Если хотите, скажу, как :-).

Posted by

fregimus.livejournal.com

Спасибо, наверное, пока не хочу, хочу в PDF вместе с текстом, но, если не удастся то, чего я хочу, то тогда начну хотеть того, что Вы предлагаете. Тогда Вас расспрошу, хорошо?

А в какой программе эта опция — экспортировать текст? Выделить и копировать текст могу, а вот экспортировать — нет.

Re: Не все так страшно

Posted by

vadim-i-z.livejournal.com - 2008-10-15 20:23 (UTC) - Expand

Re: Не все так страшно

Posted by

fregimus.livejournal.com - 2008-10-15 22:52 (UTC) - Expand

Re: Не все так страшно

Posted by

fregimus.livejournal.com - 2008-10-15 22:54 (UTC) - Expand

Posted by

misologus.livejournal.com

Как присобачить оглавление?

Re: Не все так страшно

Posted by

vadim-i-z.livejournal.com - 2008-10-16 06:26 (UTC) - Expand

Re: Не все так страшно

Posted by

vadim-i-z.livejournal.com - 2008-10-16 15:29 (UTC) - Expand

Re: Не все так страшно

Posted by

misologus.livejournal.com - 2008-10-16 18:03 (UTC) - Expand

Re: Не все так страшно

Posted by

vadim-i-z.livejournal.com - 2008-10-16 18:06 (UTC) - Expand

Posted by

inkogniton.livejournal.com

о, если Вам чего дельного насоветуют, скажите мне тоже, а? тоже мучаюсь.....

Posted by

runixonline.livejournal.com

Извините - но Вы ТРИЖДЫ сказали фигню . DJVU имеет массу преимуществ перед PDF при работе с ИЗНАЧАЛЬНО БУМАЖНЫМИ ( отсканироваными ) документами

Немного матчасти
1. Все вышеперечесленые "вкусности" есть только в PDF , изначально созданом как компьютерный документ. А в мире масса PDF документов в кторых лежат только голые сканы. Там все это НЕ работает - есть только чудовищных размеров файлище с картинками

2. Да в DJVU создавался в первую очередь для хранения ОТСКАНИРОВАНЫХ ( изначально бумажных) документов. И здесь он бьет акробат вчистую - файлы намного меньше при том же качестве просмотра .Но OCR слой в него таже вставляется .. просто большинство DJVUiys[ rybu ltkf.n k.,bntkb b bv 'nbv ktym pfvjhfxbdfnmcz/

3. В DJVU точно также можно вставить OCR слой , и потом индексировать для быстрого поиска, вставлять закладки и т.д как сделать - см здесь и далее - по ссылкам (http://rus7.com/node/16)

Единственное. чем не интерсовался - как винду заставить его индексировать.

Программа перекодировки есть. Fine Reader 9 называется .:) При наличии ОСR слоя распознает его прекрасно ( правда надо чуток над ним пошаманить - в официальной поставке нужных DLL нет, они есть толко в SDK .... но найти их труда не составит )

Posted by

runixonline.livejournal.com

ПС Просто большинство DJVU - это неофициальные ( пиратские ) сканы книг - обычно пирату лень вылизывать текст

Интересное рассуждение

Posted by

fregimus.livejournal.com - 2008-10-15 19:41 (UTC) - Expand

Re: Интересное рассуждение

Posted by

runixonline.livejournal.com - 2008-10-15 19:55 (UTC) - Expand

Posted by

allambee.livejournal.com

индексируются при помощи djvu ifilter, который раньше можно было скачать с сайта того же lizardtech, а сейчас он должен быть на сайте celartem, только тот не открывается у меня. под гну/линукс тоже индексируются - через djvulibre. иерархию закладок okular пока не поддерживает.

alterum fregi, alterum amisi!

Не дежавю

Page Summary

Style Credit

Expand Cut Tags