URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 1714
[ Назад ]

Исходное сообщение
"Каталог Программ: pdftohtml converts Portable Document Format files to HTML"

Отправлено auto_prog , 12-Мрт-03 16:52 
Преобразователь из формата PDF в HTML.

URL: http://sourceforge.net/projects/pdftohtml/
Обсуждается: http://www.opennet.me/prog/info/658.shtml


Содержание

Сообщения в этом обсуждении
"перевод из формата в формат"
Отправлено Владимир , 12-Мрт-03 16:52 
Работает прога нормально. Одна проблема - кириллицу не берет :(.
Если кто-то знает где взять тулзу для кириллицы с аналогичными функциями - напишите пожалуйста.

"перевод из формата в формат"
Отправлено Mumbo Jumbo , 05-Авг-03 19:03 
Advanced PDF to HTML Converter версии 1.5  берет кириллицу,в отличие от предыдущих версий, но без регистрации эта прга   все распознанные страницы и картинки загадит напоминаниями, что это демо-режим ... А того, чем ее зарегистрировать найти никак не удается.

"pdftohtml (pdf2html) converts Portable Document Format files to HTML"
Отправлено Alexander Mayorov , 14-Янв-05 03:05 
Отлично работает с русским!
Надо только установить файл поддержки кириллицы для xpdf (можно взять на домашней странице xpdf), раздел download.
потом в командой строке указать использовать чарсет KOI8-R и конвертит, не очень качественно, правда, но конвертит

"pdftohtml (pdf2html) converts Portable Document Format files..."
Отправлено Sergey Safronov , 14-Янв-08 15:41 
А как его указать в командной строке, я там такой опции не нашел ?

"pdftohtml (pdf2html) converts Portable Document Format files to HTML"
Отправлено Soul , 17-Апр-08 00:49 
pdftohtml.exe -enc UTF-8 1.pdf 1\1.html

"pdftohtml: how to convert file with images?"
Отправлено Grigory , 03-Фев-09 13:37 
Помогите, пожалуйста, пользователи pdftohtml.
Как сконвертировать файл с картинками?
'pdftohtml' правильно обрабатывает файл, но не создаёт картинки. Вместо них каждая сгенерённая html-страница имеет "background image", ссылку на файл с расширением .png, имя которого соответствует номеру страницы. Но самого этого файла нигде нет.
OS WindowsXP
Запускаю вот так:
pdftohtml -c myfile.pdf
Как получить картинки?
Спасибо.

"pdftohtml: how to convert file with images?"
Отправлено Grigory , 04-Фев-09 12:57 
Отвечаю сам себе. В текущем каталоге (или в одном из путей %PATH%) должны находиться файлы утилиты gswin32c.exe:
gsdll32.dll
gswin32.exe
gswin32c.exe
Утилита есть здесь: http://www.f1cd.ru/soft/base/gpl_ghostscript/gpl_ghostscript.../

"pdftohtml: how to convert file with images?"
Отправлено Вера , 24-Фев-10 21:32 
Большое спасибо за найденное решение!