Перейти к содержанию
    

DJVU 2 WORD

Подскажите пожалуйста программку для преобразования отсканированного текста (формат DJVU) в обычный wordовсий формат. Что-то типа проги pdf2word или pdf2html.

Заранее спасибо!

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Как я понимаю, столько не живут. Тут может быть только последовательный перевод в картинку, а затем распознавалкой типа FineReader'а в текст.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Поддерживаю.

Я распечатываю DJVU в формат pdf на виртуальном принтере pdfFactory. Затем получившийся pdf-ник открываю в FineReader. Лучшего способа не знаю.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

В FineReader 8 есть небольшая утилита для захвата текста прямо с экрана Screenshot Reader, очень удобно, если нужно оперативно распознавать не большой объем. Выделил прямо на экране кусок из отсканированной книги и через 2-3 секунды распознанный текст уже в буфере / word / …

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

В FineReader 8 есть небольшая утилита для захвата текста прямо с экрана Screenshot Reader, очень удобно, если нужно оперативно распознавать не большой объем. Выделил прямо на экране кусок из отсканированной книги и через 2-3 секунды распознанный текст уже в буфере / word / …
Оказывается похожую штуку можно провернуть и в FineRider 7. Нажимаем Alt+PrintScreen (или просто PrintScreen) открываем FineRider, Ctrl+V. Распознаем вставленную картинку.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

На самом деле все зависит от того кто этот DJVU жал. Формат DJVU позволяет добавлять распознанный текст, который также как в PDF - файлах можно выделить и скопировать. Однако возни при создании такого DJVU файла много. Поэтому я всего несколько штук таких встречал.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Действительно, ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет....(да и вообще возможности формата ДеЖавю зачастую ооочень нерационально используются).... а проще всего дежавюку в текст перевести imho следующим образом : 1.ищем в сети прогу(есть очнь хорошая весч от молдавских, вроде, камрадов) ктороая переводит дежавюку в картинку(Jpeg, tiff, многостраничный tiff)

2. грузим соотв. файлы в файнридер и жмём распознать....

3. сохраняем результат....

 

инджой...

 

ЗЫ не забывайте про гугль

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Уважаемый LordN на своем сайте предлагает нескоько программок для работы с DJVU-форматом http://lord-n.narod.ru/plugin.html

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Действительно, ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет....(да и вообще возможности формата ДеЖавю зачастую ооочень нерационально используются)....

А не могли бы вы подсказать, как при переводе в DJVU можно создать этот текстовый слой? В DjvuSolo есть такая возможность? :smile3046:

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Гость LordN
А не могли бы вы подсказать, как при переводе в DJVU можно создать этот текстовый слой

надо найти дежавю-мэйкер с OCR.

раньше тут http://www.scan-elib.narod.ru/djvu/ (это вообще самая большая подборка в русской сети халявных ссылок на проги для дежавюшек) был Document Express Enterprise with DjVu v5.1 build 946 (with Asian OCR) я им OCR в дежавю вставляю.

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Vanёk, вот здесь есть небольшое описание (pdf) про то, как сделать хорошую элетронную книгу. Расписаны все этапы: начиная со сканирования и заканчивая внедрением текстового слоя и сбором содержания. А вот тут - IMHO, тот же самый материал в формате doc.

ДеЖавю позволяет делать "текстовый" слой , с которым можно работать как с обычным тестом(выделять, копировать, расставлять закладки) но то ли по незнанию, то ли от лени создателей большинство сканов этого слоя не имеет
Ну, судя, скажем, по зеркалу на хоумлинуксе, этого не скажешь. Хотя в отношении технической литературы Вы, к сожалению, правы: методики качественного изготовления электронных книг в И-нете находятся без особых проблем, однако IMHO, далеко не все создаваемую эл. книгу доводят до хорошего качества.

 

Удачи!

Поделиться сообщением


Ссылка на сообщение
Поделиться на другие сайты

Присоединяйтесь к обсуждению

Вы можете написать сейчас и зарегистрироваться позже. Если у вас есть аккаунт, авторизуйтесь, чтобы опубликовать от имени своего аккаунта.

Гость
Ответить в этой теме...

×   Вставлено с форматированием.   Вставить как обычный текст

  Разрешено использовать не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отображать как обычную ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставлять изображения напрямую. Загружайте или вставляйте изображения по ссылке.

×
×
  • Создать...