URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID9
Нить номер: 9960
[ Назад ]

Исходное сообщение
"Как в Python открыть текстовый файл 'без кодировки'?"

Отправлено AV , 02-Янв-15 12:35 
Как сделать что-то типа вот такого:
fileHandle = open(filename, 'r', encoding=None)

чтобы encoding не использовалось?

Есть файл, созданный из Shell редиректом StdOut в этот файл. Файл со списком имён файлов. Хочу прочитать его Питоном и т.д.

Файл в UTF8, как я понимаю. Что-то в нём кривое оказалось (кривое имя - имя файла, когда-то сохранённого из WWW). Содержимое файла корректно можно увидеть не в каждом текстовом редакторе.

Файл со списком просто так не парсится Питоном -

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc4 in position 7943: invalid continuation byte

Как побороть?

P.S. В Питоне поигрался с codecs - нужного сочетания не нашёл (но его и нет, как я понимаю)

import codecs
fileHandle = codecs.open(fileWithDigest, 'r', encoding=xxx)


Содержание

Сообщения в этом обсуждении
"Как в Python открыть текстовый файл 'без кодировки'?"
Отправлено AV , 02-Янв-15 14:08 
Вот файл с битыми именами:
http://wikisend.com/download/402748/broken-names.log.gz

Например, 9-я строка

f471c0e7efcaf9b11dba3cce1bf461d2 *./MikroTik_RouterOS_Ä%8Dlanci


"Как в Python открыть текстовый файл 'без кодировки'?"
Отправлено Аноним , 08-Янв-15 14:09 
> Как сделать что-то типа вот такого:
>
fileHandle = open(filename, 'r', encoding=None)

Попробуйте как бинарный открывать:

open(filename, 'rb')

А дальше уже к какой-нибудь кодировке приводить там, где это нужно.