The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

pstotext - extract plain text from PostScript and PDF files

Дата
13 Jan 2005
Заголовокpstotext - extract plain text from PostScript and PDF files
ПояснениеПрограмма для преобразования PS или PDF файлов в текстовый формат (для поддержки русского нужно патчить).
  • Единственное нормальное средство для конвертации в текст из PDF или PS с кириллицей внутри, утилита pdftotex из комплекта xpdf: "pdftotext -enc KOI8-R test.pdf";
  • PreScript - утилита на Python для вытаскивания текста из PostScript файлов , возможен вывод в HTML формате;
  • ps2html - конвертирует PostScript в HTML с максимальным сохранением форматирования.
  • PsToEdit - ковертирует PostScript и PDF во всевозможные форматы, включая текст и HTML;
  • Из pdf можно сконвертировать в PS используя pdf2ps.
  • Используя ghostscript можно конвертировать так:
    gs -q -dNODISPLAY -dNOBIND -dWRITESYSTEMDICT -dSIMPLE -c save -f ps2ascii .ps fite.ps -c quit
  • Home URLhttp://www.research.compaq.com/SRC/virtualpaper/pstotext.html
    Флагenglish
    РазделПреобразование из одного формата в другой
    Ключи

     Добавить ссылку
     
     Поиск ссылки (regex):
     

    Последние заметки
    << Предыдущие 15 записей
    - 08.09.2022 Создание виртуальных машин с помощью Qemu KVM
    - 25.07.2022 Создание программ под SynapseOS
    - 24.07.2022 Случайная задержка в shell-скрипте, выполняемом из crontab (без башизмов)
    - 03.07.2022 Выборочное туннелирование сайтов через WireGuard
    - 19.05.2022 Настройка шрифтов для консоли и терминала
    - 26.02.2022 Тестирование хелловорлда под 17 платформ одним скриптом
    - 23.02.2022 Скрипт для конвертации архива gz в lzma
    - 06.12.2021 Сравнение методов исключения разработки на JavaScript для веб технологий
    - 30.11.2021 Отправка логов из kubernetes в clickhouse
    - 03.11.2021 Linux окружение noroot в Android-смартфоне собственными руками.
    - 02.11.2021 Борьба с троллингом на opennet.ru при помощи uBlock Origin
    - 20.10.2021 Сборка хелловорлда под 17 платформ одним скриптом
    - 11.09.2021 Шифрование данных на существующем разделе ext4 без его переформатирования
    - 04.08.2021 Прямая отправка заданий на принтер, без использования CUPS и других прослоек
    - 19.06.2021 Запуск процесса с совсем-совсем IDLE приоритетом в Linux
    Следующие 15 записей >>




    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру