Преобразователь из формата PDF в HTML.URL: http://sourceforge.net/projects/pdftohtml/
Обсуждается: http://www.opennet.me/prog/info/658.shtml
Работает прога нормально. Одна проблема - кириллицу не берет :(.
Если кто-то знает где взять тулзу для кириллицы с аналогичными функциями - напишите пожалуйста.
Advanced PDF to HTML Converter версии 1.5 берет кириллицу,в отличие от предыдущих версий, но без регистрации эта прга все распознанные страницы и картинки загадит напоминаниями, что это демо-режим ... А того, чем ее зарегистрировать найти никак не удается.
Отлично работает с русским!
Надо только установить файл поддержки кириллицы для xpdf (можно взять на домашней странице xpdf), раздел download.
потом в командой строке указать использовать чарсет KOI8-R и конвертит, не очень качественно, правда, но конвертит
А как его указать в командной строке, я там такой опции не нашел ?
pdftohtml.exe -enc UTF-8 1.pdf 1\1.html
Помогите, пожалуйста, пользователи pdftohtml.
Как сконвертировать файл с картинками?
'pdftohtml' правильно обрабатывает файл, но не создаёт картинки. Вместо них каждая сгенерённая html-страница имеет "background image", ссылку на файл с расширением .png, имя которого соответствует номеру страницы. Но самого этого файла нигде нет.
OS WindowsXP
Запускаю вот так:
pdftohtml -c myfile.pdf
Как получить картинки?
Спасибо.
Отвечаю сам себе. В текущем каталоге (или в одном из путей %PATH%) должны находиться файлы утилиты gswin32c.exe:
gsdll32.dll
gswin32.exe
gswin32c.exe
Утилита есть здесь: http://www.f1cd.ru/soft/base/gpl_ghostscript/gpl_ghostscript.../
Большое спасибо за найденное решение!