The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  ВХОД  слежка  RSS
"Работа с кодировкой темы письма при построении почтового арх..."
Вариант для распечатки  
Пред. тема | След. тема 
Форумы Программирование под UNIX (Public)
Изначальное сообщение [Проследить за развитием треда]

"Работа с кодировкой темы письма при построении почтового арх..." 
Сообщение от edwin emailИскать по авторуВ закладки(ok) on 03-Сен-05, 06:28  (MSK)
Добрый день коллеги.
Некоторое время назад занявшись построением системы почтового архива  я столкнулся с ОЧЕНЬ неприятной проблемый:
Темы письма выглядят:
Re: =?KOI8-R?Q?=F3=C5=D7=C1=D3=D4=CF=D0=CF=CC=D8,_=D5?=
=?KOI8-R?Q?=C4=C1=CC=C5=CE=CE=C1=D1_=D0=CC=CF=DD=C1=C4=CB=C1,_3/=D5=CC._?=
=?KOI8-R?Q?=E2._=ED=CF=D2=D3=CB=C1=D1,?= 21/ |
Это проблемы не программы - в таком виде письма попадают ко мне на анализ. ;((
Не известно ли Вам метода по преобразованию этого бреда в нечто удобоваримое.
Базовый язык - python.
Но буду благодарен, если Вы мне поможете решить данную проблемы в любом другом языке.
  Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

 Оглавление

Индекс форумов | Темы | Пред. тема | След. тема
Сообщения по теме

1. "Работа с кодировкой темы письма при построении почтового арх..." 
Сообщение от vnp emailИскать по авторуВ закладки(??) on 04-Сен-05, 00:43  (MSK)
>Re: =?KOI8-R?Q?=F3=C5=D7=C1=D3=D4=CF=D0=CF=CC=D8,_=D5?=
> =?KOI8-R?Q?=C4=C1=CC=C5=CE=CE=C1=D1_=D0=CC=CF=DD=C1=C4=CB=C1,_3/=D5=CC._?=
> =?KOI8-R?Q?=E2._=ED=CF=D2=D3=CB=C1=D1,?= 21/ |
>Это проблемы не программы - в таком виде письма попадают ко мне
>на анализ. ;((
>Не известно ли Вам метода по преобразованию этого бреда в нечто удобоваримое.

Тут написано "Севастополь, удаленная площадка, 3/ул. Б. Морская"

Это называется Content-Transfer-Encoding: Quoted-Printable. См, например, http://www.ietf.org/rfc/rfc2045.txt, секция 6.7.

  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

2. "Работа с кодировкой темы письма при построении почтового арх..." 
Сообщение от John Искать по авторуВ закладки(??) on 04-Сен-05, 10:05  (MSK)
Это еще пол беды, вот когда начнут попадаться письма с 8-ми битным текстом в заголовке (не обязательно в теме) и без указания кодировки, то вот это весело. Не знаю как в python, а на perl я использовал MIME::QuotedPrint, MIME::Base64 для разбора того, что Вы привели и Lingua::DetectCharset для "угадывания" кодировки. Lingua::DetectCharset можно найти на cpan.org Работает достаточно надежно: на 20000 писем - 10-20 "сомнительных" кодировок.
  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх

3. "Работа с кодировкой темы письма при построении почтового арх..." 
Сообщение от edwin emailИскать по авторуВ закладки(ok) on 05-Сен-05, 14:48  (MSK)
Всем большое спасибо
  Удалить Правка | Высказать мнение | Ответить | Рекомендовать в FAQ | Cообщить модератору | Наверх


Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ]
Пожалуйста, прежде чем написать сообщение, ознакомьтесь с данными рекомендациями.




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру