The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Обновление Debian 12.5 и 11.9"
Отправлено WatchCat, 16-Фев-24 16:59 
> У UTF8 тоже есть свои ограничения на применения. Да, например в вебе он хорош.
>Да он мне и в системе норм.

Что несколько не типично,учитывая что вы с микроконтроллерным железом дело имеете,где
типично байт==символ. Например во всех виденных мной знакосинтезирующих индикаторах.
Причем в китайских индикаторах мне попадались и зашитые в знакогенератор русские буквы
и даже иероглифы. Но все они адресовались именно одним байтом.
Также при обмене с консолью устройства через терминал тоже байт==символ.

> Более того - существование 5 представлений русского (CP866, 1251, ISO8859, KOI8, UTF) я считаю >издевательством над людьми и здравым смыслом.

Насчет издевательства - согласен. Но вместо того чтобы имевшиеся четыре уменьшить хотябы до двух наиболее употребительных, сделали наоборот и добавили пятое. Прямо как в той картинке про "четырнадцать конкурирующих стандартов". https://xkcd.ru/927/
Кстати, еще EBCDIC забыли, массово применявшийся на ЕС ЭВМ. Магнитные ленты - штука живучая, в научных учреждениях и сейчас еще лежат. Была у меня в 90е задачка - написание софта к плате сопряжения магнитофона ЕС5612 с ПЭВМ (АТ286).

>Вероятно у меня не осталось подобных массивов, представляющих ценность, в той кодировке. Во >всяком случае не помню когда и где я вообще выбирал бы CP866.

А моя активная трудовая деятельность пришлась на 90е,когда и базоданные и текстовые файлы наиболее часто были именно в этой кодировке. Включая целые книги. Причем если мелкие ошибки при перекодировке художественных текстов несущественны,то в технических текстах они могут сильно искажать смысл. А тогда нередко бывало что еще и электронные(и не только) схемы в качестве иллюстраций к тексту рисовали псевдографическими символами. Такое куда-то перекодировать - вообще чаще всего фигня получится.

> Она может быть написана и как одна буква U+0401 и как буква отдельно,
> а точки сверху отдельно (U+0415 U+0308). И все владельцы фамилий с этой
> буквой снова огребают проблемы.
>Простому смертному редко что хорошее обламывается от хранения о нем сведений в базах, так что >срыв лукапа или возможность оспорить результат лишний раз - может и фичой быть.

Теоретически да,возможно. Но на практике проблемы это создает чаще чем дает бонусы.
Например раньше при покупке недвижимости госорганы выдавали настоящее свидетельство о праве собственности - на гербовой бумаге. А с некоторых недавних пор повадились вместо нормального
документа выдавать "выписку из реестра" в виде обычного распечатанного на принтере листка.
Вот у меня на один объект недвижимости документ есть,а на другой - только такая бумажка.
Нетрудно понять что будет если в том непонятно как и где хранимом реестве потеряются точки
над "Ё" в фамилии владельца. И если буква это неделимое целое то и потерять можно ее целиком,а когда буква это несколько байтов+некие зашитые в софте правила объединения их в букву - то последствия могут быть самые разные. Фактически моя фамилия сейчас хранится частично в базе,а частично в софте который с ней работает(те самые правила объединения байтов в буквы). Учитывая
что даже в рамках стандарта уже два варианта представления существует - открывается достаточно
возможностей для случайных(или даже не очень) глюков.
А квалификация компьютерных специалистов в госслужбах лично у меня
особого доверия не вызывает. Так что тут правильнее будет сказать не "если",а "когда".

> Эти траблы и сейчас никуда не делись из тех мест где работают с большими и давно
> собираемыми архивами данных на языках,отличных от английского,на русском например.
>А таки некромансить - мертворожденный подход.

Не некромансить,а поддерживать совместимость и преемственность.
Подход революционеров из начала прошлого века в стиле "до основания разрушим,а затем..." себя не
оправдал.
К счастью никто пока не предлагает выбросить(или срочно перекодировать) архивы документов из дореволюционных времен только потому что они в дореволюционной же "кодировке" написаны с "ятями" и "ерами" всякими. Кстати - классический пример перекодировки с потерей смысла - название романа "Война и мiръ"(издание 1913 года) и современное написание "Война и мир". В результате рядовые читатели теперь не знают имел ли в виду писатель слово "мир" в значении противоположном войне,или же в несколько ныне архаичном значении "общество". Даже в Гугле мнения на эту тему встречаются
различные.

>Ради вон тех майнтайнить вечно вон то никто не будет, а хватит ли на это какихнить альтов - >вопрос открытый.

Всё давно уже сделано. Никто не требует от кого-то работу работать за бесплатно. Надо просто
положить в дистрибутив готовое. У меня (ни разу не спеца по сборке пакетов) применение
того патча занимает ну полчаса,плюс собственно сборка,которая так и так делается. И то так долго
лишь потому что теперь в пакете Иксов используется очень неудобный quilt. Пока его там небыло - было еще проще и быстрее.
Если добиться включения этого патча в Дебиан,а лучше даже а апстрим Иксов - то ничего не надо будет как-то дополнительно майнтайнить пока в линуксе используются иксы.
Если когда-то допилят wayland до пригодности к использованию - ну тогда будем смотреть как к нему прикрутить поддержку всех русских кодировок. Ибо отменить это историческое наследие уже не получится также как те "яти" с "ерами" или допустим церковнославянское письмо. Или латынь в медицине.

И вот тут имеет преимущество российский дистрибутив - потому что его мейнтейнеры хотябы имеют
понимание данной проблемы,в отличие от американцев. Соответственно и вести дискуссию с нашими намного проще - меньше объяснять придется зачем такие патчи включать.

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, [email protected] (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру