Обсуждение статьи тематического каталога: PHP скрипт для автоматического определения кодировки текста (charset codepage php)Ссылка на текст статьи: http://www.opennet.me/base/dev/charset_autodetect.txt.html
Не пашет. Слово "Введение" определяет как ISO, а не Win-1251
Текст, набранный ЗАГЛАВНЫМИ БУКВАМИ определяет как KOI-8, а не win-1251
Вот пример рабочего скрипта http://popoff.donetsk.ua/text/work/libs/a/charset/
скачайте файл и вот вам готовая функция
Текст, набранный только заглавными в ср1251 или только строчными в koi8-r попадает в один и тот же диапазон символов(191..224), так что однозначно определить кодировку попросту невозможно.
И это ещё не учли unicode...
А какже тогда определяют кодировку на других языках?
Этот скрипт не работает и никогда не будет работать.
Надо использовать частотный словарь слогов хотя бы.