URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 67820
[ Назад ]

Исходное сообщение
"pdftohtml и разные кодировки."

Отправлено astashov , 25-Июл-06 09:30 
Здравствуйте.
Система ФриБСД5.4
Такой вопрос есть к Вам.

Есть обычный pdf файл. Хочу перевести его с помощью pdftohtml в хтмл'ку. Но программа игнорирует русские буквы в файле. Понятное дело, что не знает об этой кодировке. Ладно. пишу потом:

pdftotext -enc KOI8-R file.pdf html/file.html

И получаю:

Error: Couldn't find unicodeMap file for the 'KOI8-R' encoding

А как мне настроить понимание кодировки? где он ее ищет?
Может кто нибудь подскажет?
Заранее спасибо.


Содержание

Сообщения в этом обсуждении
"pdftohtml и разные кодировки."
Отправлено astashov , 26-Июл-06 05:59 
Ну хоть намек дайте, в какую сторону копать. Может у кого было такое.

"pdftohtml и разные кодировки."
Отправлено butcher , 26-Июл-06 16:06 
>Ну хоть намек дайте, в какую сторону копать. Может у кого было
>такое.

http://www.opennet.me/search.shtml?words=pdf2html


"pdftohtml и разные кодировки."
Отправлено astashov , 27-Июл-06 06:27 
>http://www.opennet.me/search.shtml?words=pdf2html

Респект.
А я ступил не по детски. Бывает.