Как сделать что-то типа вот такого:fileHandle = open(filename, 'r', encoding=None)чтобы encoding не использовалось?
Есть файл, созданный из Shell редиректом StdOut в этот файл. Файл со списком имён файлов. Хочу прочитать его Питоном и т.д.
Файл в UTF8, как я понимаю. Что-то в нём кривое оказалось (кривое имя - имя файла, когда-то сохранённого из WWW). Содержимое файла корректно можно увидеть не в каждом текстовом редакторе.
Файл со списком просто так не парсится Питоном -
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc4 in position 7943: invalid continuation byteКак побороть?
P.S. В Питоне поигрался с codecs - нужного сочетания не нашёл (но его и нет, как я понимаю)
import codecs
fileHandle = codecs.open(fileWithDigest, 'r', encoding=xxx)
Вот файл с битыми именами:
http://wikisend.com/download/402748/broken-names.log.gzНапример, 9-я строка
f471c0e7efcaf9b11dba3cce1bf461d2 *./MikroTik_RouterOS_Ä%8Dlanci
> Как сделать что-то типа вот такого:
>fileHandle = open(filename, 'r', encoding=None)Попробуйте как бинарный открывать:
open(filename, 'rb')А дальше уже к какой-нибудь кодировке приводить там, где это нужно.