URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID1
Нить номер: 67820
[ Назад ]

Исходное сообщение
"pdftohtml и разные кодировки."
Отправлено astashov , 25-Июл-06 09:30

Здравствуйте.
Система ФриБСД5.4
Такой вопрос есть к Вам.
Есть обычный pdf файл. Хочу перевести его с помощью pdftohtml в хтмл'ку. Но программа игнорирует русские буквы в файле. Понятное дело, что не знает об этой кодировке. Ладно. пишу потом:
pdftotext -enc KOI8-R file.pdf html/file.html
И получаю:
Error: Couldn't find unicodeMap file for the 'KOI8-R' encoding
А как мне настроить понимание кодировки? где он ее ищет?
Может кто нибудь подскажет?
Заранее спасибо.

Содержание

pdftohtml и разные кодировки.,astashov, 05:59 , 26-Июл-06
- pdftohtml и разные кодировки.,butcher, 16:06 , 26-Июл-06
  - pdftohtml и разные кодировки.,astashov, 06:27 , 27-Июл-06

Сообщения в этом обсуждении

"pdftohtml и разные кодировки."
Отправлено astashov , 26-Июл-06 05:59

Ну хоть намек дайте, в какую сторону копать. Может у кого было такое.

"pdftohtml и разные кодировки."
Отправлено butcher , 26-Июл-06 16:06

>Ну хоть намек дайте, в какую сторону копать. Может у кого было
>такое.
http://www.opennet.me/search.shtml?words=pdf2html

"pdftohtml и разные кодировки."
Отправлено astashov , 27-Июл-06 06:27

>http://www.opennet.me/search.shtml?words=pdf2html
Респект.
А я ступил не по детски. Бывает.