URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 13400
[ Назад ]

Исходное сообщение
"Тематический каталог: PHP скрипт для автоматического определения кодировки текста (charset codepage php)"

Отправлено auto_topic , 26-Янв-06 17:35 
Обсуждение статьи тематического каталога: PHP скрипт для автоматического определения кодировки текста (charset codepage php)

Ссылка на текст статьи: http://www.opennet.me/base/dev/charset_autodetect.txt.html


Содержание

Сообщения в этом обсуждении
"PHP скрипт для автоматического определения кодировки текста (charset codepage php)"
Отправлено HoLoD , 26-Янв-06 17:35 
Не пашет. Слово "Введение" определяет как ISO, а не Win-1251

"PHP скрипт для автоматического определения кодировки текста (charset codepage php)"
Отправлено Roman , 06-Дек-06 10:42 
Текст, набранный ЗАГЛАВНЫМИ БУКВАМИ определяет как KOI-8, а не win-1251

"PHP скрипт для автоматического определения кодировки текста (charset c"
Отправлено PblCb , 20-Июл-07 19:47 
Вот пример рабочего скрипта   http://popoff.donetsk.ua/text/work/libs/a/charset/
скачайте файл и вот вам готовая функция

"без коллизий невозможно"
Отправлено skyboy , 19-Фев-09 18:48 
Текст, набранный только заглавными в ср1251 или только строчными в koi8-r попадает в один и тот же диапазон символов(191..224), так что однозначно определить кодировку попросту невозможно.
И это ещё не учли unicode...

"PHP скрипт для автоматического определения кодировки текста (charset codepage php)"
Отправлено hfrghfewu , 04-Июн-10 00:23 
А какже тогда определяют кодировку на других языках?

"PHP скрипт для автоматического определения кодировки текста ..."
Отправлено Rusty , 31-Дек-10 15:45 
Этот скрипт не работает и никогда не будет работать.
Надо использовать частотный словарь слогов хотя бы.