Разработчики OpenBSD прекращают (http://marc.info/?l=openbsd-cvs&m=143956261214725&w=2) поддержку использования в базовой системе локалей, отличных от UTF-8. Однобайтовые локали, такие как ISO-8859-1, CP1251 и KOI-8 не будут входить в состав базовой системы, начиная с OpenBSD 5.9. Подобный ход позволит (http://undeadly.org/cgi?action=article&sid=20150722182236) упростить разработку и поддержку, так как во всех компонентах системы достаточно будет реализовать поддержку только одной кодировки.
В настоящее время идёт активная работа по адаптации утилит OpenBSD для работы с UTF-8, при этом значительно проще провести такую работу путем замены кода поддержки однобайтовых кодировок на UTF-8, вместо реализации одновременной поддержки моногобайтовых и однобайтовых локалей. После многочисленных обсуждений сделан вывод, что наиболее оптимальным является обеспечение полноценной и качественной поддержки универсальной кодировки UTF-8, ценой исключения устаревших однобайтовых кодировок.
URL: https://news.ycombinator.com/item?id=10061028
Новость: http://www.opennet.me/opennews/art.shtml?num=42795
Если будут удалены все локали кроме юникода, то что останется в консоли?!
Думай,старшина,думай!
Патчи для контролера клавы, чтоб она генерила UTF-cкан-коды будут?
И кстати да, почему не UTF-32? Кетайская клавиатура негодуе!!!
utf8 может китайский и любой другой
и каким образом связаны сканкоды и кодировка?
> и каким образом связаны сканкоды и кодировка?Думай,старшина,думай!
Все ты привык, что за тебя думают
> Все ты привык, что за тебя думаютНе легко нам, Царям.
При чём здесь сканы? У нас нет клавиатур с десятками тысяч клавиш. Сканы переводятся в раскладку. А раскладка связана с целевой кодировкой. Как бы то ни было, сканы стандартной клавиатуры ориентированы на основной латинский алфавит.
> Как бы то ни было, сканы стандартной клавиатуры ориентированы на основной латинский алфавит.Воооот, а надо патчи под UTF )
Сканы всего лишь указывают номер нажатой кнопки. Которая может быть связана с уже с любой буквой в любой раскладке.
Например есть большие и маленькие буквы но клава выдаёт скан коды для кнопки всегда одинаковые, не зависимо от раскладки шифтов и кэпсов. Поэтому сканы вообще не на что не ориентированы.
> Если будут удалены все локали кроме юникода, то что останется в консоли?!Её тоже удалят, она не нужна, так что товарищ Старшина налево кругом шагом аааарш!
Задай вопрос сержанту
"C" пусть тоже удалят.
Есть C.UTF-8.
ну, рано или поздно это должно было произойти
Не в таком виде. Так мы заходим на второй виток проблемы с кодировками когда все начнут пользовать Utf-16, а софт не будет рассчитан на кодировки отдельные от Utf-8
>начнут пользоватьиспользовать
>все начнут пользовать Utf-16Все уже закончили использовать UTF-16
>UTF-16 is the worst of both worlds—variable length and too wide. It exists for historical reasons, adds a lot of confusion and will hopefully die out.
>Utf-16UTF-16
>Utf-8UTF-8
Хорошо им говорить, что UTF-16 слишком широкий, они видимо только латиницей пользуются. Для кириллицы UTF-8 точно такой же. Только извлечение кодов символов, да и вообще вся работа со строками потребляет больше процессорного времени.
> Для кириллицы UTF-8 точно такой же.Расслабься, из 7 млрд. населения планеты кириллица нужна максимум 200 млн. Для азиатских языков разница имхо не так существенна. Кроме того, в потрохах ПО (исходники, файлы настроек, протоколы взаимодействия) 90% - это однорбайтовый ascii, для которого utf-16 и является слишком широким.
И непонятно, за счёт чего, по-вашему, utf-8 должно требовать больше процессорного времени, чем utf-16. В первой, по крайней мере, не нужно плясок с big endian/little endian.
Сегодня utf-16 это (как уже сказали ниже) фактически подпорка для устаревшего софта, который никто не будет переписывать (да-да, Windows и Java). Это пережиток времён, когда utf-16 было достаточно для действительно всех символов уникода и его использовали, не задумываясь, что будет, когда его перестанет хватать. Сейчас же можно просто использовать utf-8, где важна/имеет смысл экономия памяти, и ucs-4 где требуется скорость работы и простота реализации.
>> Для кириллицы UTF-8 точно такой же.
> Расслабься, из 7 млрд. населения планеты кириллица нужна максимум 200 млн.А вот и нет. Не надо путать кириллицу и русский язык. Монголы тоже на кириллице сидят, к примеру.
> А вот и нет. Не надо путать кириллицу и русский язык. Монголы
> тоже на кириллице сидят, к примеру.Педивикия заявляет, что их от силы 10 мильенов ...
> Педивикия заявляет, что их от силы 10 мильенов ...Вообще-то есть еще всякие болгары и прочие. У них тоже кирилица.
> Хорошо им говорить, что UTF-16 слишком широкий...На самом деле это всё чушь. UTF-16 сдох только лишь из-за несовместимости с ASCII. Вот UTF-8 можно как-то пропихнуть через древние системы, а UTF-16 нельзя - под него нужно совсем всё переделывать.
>UTF-8 можно как-то пропихнуть через древние системыИ через американцев.
>Все уже закончили использовать UTF-16это в файликах и прочих стораджах, но там и не начинали
а вот внутрях у многих UTF-16/UCS-2: Java, Qt, .NET, питон вообще UTF-32, емнип
UTF-16 "во внутрях" у тех, кто в неё вляпался исторически.
> UTF-16 "во внутрях" у тех, кто в неё вляпался исторически.не думаю что они сильно недовольны этим.
>> UTF-16 "во внутрях" у тех, кто в неё вляпался исторически.
> не думаю что они сильно недовольны этим.Несовместима с семибитной ASCII, расходует в среднем как UCS-2, проблемы с обработкой те же, что и с UTF-8? Now that's lucrative, подумали по ту сторону лужи...
UCS-2 хватит всем (С), семибитки не нужны, а вероятность "расширенных" кодов (право, не знаю как это правильно называется) гораздо ниже чем у утф-8 для большинства языков.
>>> UTF-16 "во внутрях" у тех, кто в неё вляпался исторически.
>> не думаю что они сильно недовольны этим.
> Несовместима с семибитной ASCII, расходует в среднем как UCS-2, проблемы с обработкой
> те же, что и с UTF-8? Now that's lucrative, подумали
> по ту сторону лужи...интересная ссыль на тему http://utf8everywhere.org/ надо будет осилить
Лучше никогда чем никогда.
Что будет с UTF-16?
> Что будет с UTF-16?Не нужен, вот если бы ты спросил про UTF-32, то это было бы совсем другое дело.
> Не нужен, вот если бы ты спросил про UTF-32, то это было
> бы совсем другое дело.Ну да, все вс
> Не нужен, вот если бы ты спросил про UTF-32, то это было
> бы совсем другое дело.Ну да, все всё бросят и побегут переписывать с ноля все программы, системные вызовы и библиотечные функции. Аж два раза. Поэтому тебя будет ждать отличная перспектива - конвертировать представление при каждом вызове библиотечной функции, системного вызова или чего там еще. При том что конверсия не всегда однозначная и поэтому там будет море глюков.
> Что будет с UTF-16?Кому в здравом уме может понадобиться UTF-16?
Корпорация "Майкрософт" использует utf-16 в своём продукте "Windows" и достигла всемирного успеха
> Корпорация "Майкрософт"Вопрос содержал «в здравом уме».
Здравомыслящим програмистам?Из официального unicode faq:
Q: When would using UTF-16 be the right approach?
A: If the APIs you are using, or plan to use, are UTF-16 based, which is the typical case, then working with UTF-16 directly is likely your best bet. Converting data for each individual call to an API is difficult and inefficient, while working around the occasional character that takes two 16-bit code units in UTF-16 is not particularly difficult (and does not have to be expensive).
Q: How about converting to UTF-32?
A: If your platform or i18n library supports UTF-32 (4-byte) characters, then, for similar reasons, you might want to use them instead of UTF-16. Generally, the simplest approach is to match your basic character and string datatype to that used by the APIs you need to call.
However, UTF-32 is often a poor choice for high performance, since (on average) only half as many characters will fit your processor cache.
Many libraries, such as ICU or Java 5, use a hybrid approach. For strings, they use UTF-16 to reduce storage, but for single-character APIs they use code points (UTF-32 values) for API simplicity.
>"Майкрософт" использует utf-16 в своём продукте "Windows" и достигла всемирного успехаЗдесь, конечно же, это всех очень впечатляет, ага.
> Здесь, конечно же, это всех очень впечатляет, ага.Особенно впечатлит если попробовать программу написать. В случае UTF-8 в большинсве случаев можно вообще ничего о нем не знать. Ну то-есть попросить систему создать файл с UTF-8 именем, даже не зная что оно UTF-8. И создастся.
В некоторых случаях (разбор текста) узнать кое-что конечно придется. Но это капля в море. И совершенно не сравнимо с тем жутким крындецом, который творится в винде с ansi vs oem vs unicode.
> Корпорация "Майкрософт" использует utf-16 в своём продукте "Windows" и достигла
> всемирного успехаА с кодировками там по прежнему жесть и афиг. Ну хоть консоль то смогла уже в уникоде начать работать без плясок с бубном? И программы при этом как, не глючат? А то когда командлайновый архивер паукет файлы - в архиве одно. А когда гуйный - другое. Очень доставляет пользователям с кириллическими названиями файлов - в 50% случаев раскатывается мусор. Еще больше доставляет виндопрограмерам, которые мумукаются с тремя разными представлениями одного и того же - ANSI, OEM и Unicode.
RIP openbsd.
А я чуть на нее не перешел в преддверии завершения поддержки 8 ветки freebsd.
9 -очень странная, не верю, что 10.x лучше.
Придется на убунту переходить... А она тормозная или дебиан. Скорее убунта, так как дебиан полностью потребуется обновлять чаще и геморнее.На *никсы спецы забили, похоже. Остаются одни дилетанты
Дебиан отлично обновляется, и отсутствие тоже есть. Для дома вообще лучше тестинг использовать.
у меня домашний сервер круглосуточно работает.
Дебиан не понравился, я его ставил. В сравнении с фряхой он тормознее. Плюс к этому проблемы с обновлениями пакетов.
К сожалению, в последнее время фряха тоже перешла на пакеты, а сырцы чем дальше, тем больше их кривизна.
Пакеты тоже кривые.
Два года назад у меня практически все нужное на фряхе работало. Сейчас - только ядро и основные пакеты.
Гном и xfce практически нерабочие. Откатывать назад практически бесполезно ибо посыплется все.
ядро стейбл на 8-ке давно уже некомпилируемое. Ядро кое-как еще, а окружение не собирается.
Короче у фряхи опять большие косяки, а мне надо, чтоб сервак работал.
Я бы не парился, но приходится обновляться из-за заплат безопасности.
Присматривался к опенку, но эта новость убила напрочь. Может это прикол?
Тут поневоле готов уже убунту ставить. Не саму ее, а x- или l-, разумеется, и, конечно, lts.
Сори за многабукоф. Как-то это все достало уже.
>Гном и xfce практически нерабочие.
>а мне надо, чтоб сервак работал./0
Вот как, КАК можно было сравнвать дебиан и фрю так, чтобы оказалось, что "у дебиана проблемы с обновлениями пакетов"???
легко.Мерилом выступает степень достижимости цели и уровень геморности при этом.
6 лет назад Дебиан по этим критериям мне не подошел.
Он у меня работал несколько месяцев, несколько раз обновления обрушивали мне сервер, я плюнул на это, потратил большое время на настройку, но сервак на фре в итоге практически не падал и работал пошустрее на тех же задачах.
> Вот как, КАК можно было сравнвать дебиан и фрю так, чтобы оказалось,У меня пока две версии:
* "права оно купило, а ехать - нет." apt-get умеет, но ставит и _обновляет_ unstable.
* "хреновая фря из вашего дебиана" оно собирало-ставило порты на дебиане и очень удивилось, что обновление дебиана посносило все его зависимости^W^W^Wна ровном месте "сломало же, ну, всю же систему! магнитофон импортный. три!".> что "у дебиана проблемы с обновлениями пакетов"???
...
> и _обновляет_ unstable.нет, репозитарии по дефолту
> очень удивилось, что обновление дебиана посносило все его зависимости^W^W^Wна ровном месте...
>> что "у дебиана проблемы с обновлениями пакетов"???подтверждаю, пакеты в обновлениях убунты, дебиана и федоры иногда прилетали кривые, что изредка рушило работу приложений или вызывало KERNEL PANIC DUMP.
Если я чего-то не понимаю, то не настолько сильно, чтобы вызвать Ваш сарказм.
Проблема именно такова, как я описал. И это пройдено примерно 5-6 лет назад.
Тем не менее, спасибо за сообщение, я мог в теории допустить подобные ошибки, но не допустил.
> Присматривался к опенку, но эта новость убила напрочь. Может это прикол?Ну присмотритесь ещё к NetBSD, если так привыкли -- спросить по перспективам здесь можно того же Лёшу Чеусова (vle). Мне как-то лет пять тому другие люди характеризовали как "наиболее вменяемый из трёх проектов".
Пока оно x86-only в "виртуальбоксиках" на "локалхостиках", то оно много чего кажется "вменяемым".
> Пока оно x86-only в "виртуальбоксиках" на "локалхостиках", то оно много чего кажется "вменяемым".NetBSD x86-only??? Да Вы шутите!
>> Пока оно x86-only в "виртуальбоксиках" на "локалхостиках", то оно много чего кажется "вменяемым".
> NetBSD x86-only??? Да Вы шутите!Если что-то кроме CPU, то по факту - таки да. Или по полтора драйвера нп каждую архитектуру - это "поддерживает архитектуру"?
спасибо, попробую посмотреть на NetBSD. Помню, что там что-то нужное мне не работало, может сейчас запущу.
На фряхе я расслабился тем, что можно было и сервак использовать и иногда что-то поделать в иксах.
А сейчас - спасибо консольные приложения еще работают, а иксы и приложения под них рушатся на глазах в течение последнего примерно года, как всех на pkg принудитекьно кинули.
В смысле, что очередное обновление через раз убивает очередную нужную программу.
До pkg можно было в сырцах флаги накрутить, а сейчас какой-то кошмар
Вовремя переходите на следующую ветку, и все будет работать. Я с семерки последовательно до десятки на десктопе переходил, неразрешимых проблем не случалось. Про серверы можно и не говорить в данном контексте, все вообще прозрачно.P.S. Десятка очень хороша. Новый pkg обрастает функционалом регулярно. Вообщем, по сравнению с линуксом отставание только в wifi. Но у bsd как была сила в портах, так и осталась.
Больше внимательной практики желаю.
спасибо за советы.
Можно pkg почти игнорить, кстати. Но из-за того, что периодически нужные мне порты нестабильны и даже не собираются, это раздражает. Особенно, если это заплата по безопасности.
Я имел неосторожность довериться сборщикам би нарных пакетов pkg и поплатился. Впредь буду осторожнее и буду стараться собирать сам все. Как и делал до этого.
Время, конечно, потрачу больше, чем хотел.
> у меня домашний сервер круглосуточно работает.Тут напрашивается вопрос: кому оно нах...й нужно?!
>ядро стейбл на 8-ке давно уже некомпилируемое. Ядро кое-как еще, а окружение не собирается.А вы знаете, FreeBSD 8 уже прекратила жизненный цикл - https://www.freebsd.org/security/security.html#sup
> Короче у фряхи опять большие косяки, а мне надо, чтоб сервак работал.
Это у вас в сознании большие косяки. Операционку надо хотя бы иногда обновлять (благо, это делается с чтением /usr/src/UPDATING, /usr/ports/UPDATING и с одной-двумя перезагрузками, если всё делать по-уму).
у меня самые последние патчи для 8-ки стоят.
Я в курсе.
8.4releng
сервер мой и нужен мне
> у меня самые последние патчи для 8-ки стоят.Это достижение? А у меня FreeBSD 10.2-STABLE, которая обновляется раз в три дня пересборкой исходников, полученных из SVN. Фоновый процесс компиляции и пересборки как-то не напрягает, специальные приоритеты не выставляю, процессор Phenom II X4 810, RAM 12 ГБ.
> 8.4releng
"August 1, 2015" всё.
> сервер мой и нужен мне
Не сильно нужен, видимо.
если бы сервер не был нужен, я бы сюда не писал.
Ядро кастомное, пересобираемое при необходимости поставить заплаты безопасности.
Про август я давно помню, просто опенок неприятно удивил.
Проблемы решу непременно и спасибо всем, кто дал реально полезные советы.
Скорее бы уже ты прекратил свой жизненный цикл.
> Скорее бы уже ты прекратил свой жизненный цикл.Да ладно, пусть себе растёт флора.
> Да ладно, пусть себе растёт флора.Иначе что же будут жpaть форумные тролли?!
ты Бог?если нет - тогда научись сначала думать, прежде чем писать
> Я бы не парился, но приходится обновляться из-за заплат безопасности.
> Присматривался к опенку, но эта новость убила напрочь. Может это прикол?
> Тут поневоле готов уже убунту ставить. Не саму ее, а x- илиСтавь Генту и будет тебе счастье! :)
пока моих знаний недостаточно, чтобы поставить продакшн на gentoo
Странно переходить с BSD на что-то кроме Gentoo.
> Странно переходить с BSD на что-то кроме Gentoo.Как ни странно, даже среди бояздэшников иногда все-таки встречаются относительно адекватные персонажи, которые смогли осознать что мир не кончается на их локалхосте. И поэтому переставшие страдать фигней с качанием ЧСВ. Такие могут даже избавиться то зашоренности научиться пользоваться пакетным менеджером. Внезапно обнаружив что стало больше времени на дела помимо долботни с рутиной по майнтенансу системы.
из линуксов, наверное - да.
Но уже как-то к pf привык. Да и линукс все-таки медленнее.
Если что, фряха только сервак, а так пока xubuntu 12.04 и 14.04 на рабочей.Я на gentoo пока только посматриваю. Раньше у меня с ней было плохо все. Лет 5-7 назад примерно.
Centos - отличная штука, но тааакой тормоз...
Представляю число побитого софта и конфигураций!
> Представляю число побитого софта и конфигураций!и новых, нескучных уязвимостей
А они с релизом выпустят очередные пакеты. У них даже порты привязаны к релизу, в отличие от Free.Вообще - нормально идут. Выпилили весь старый софт, выпилили altq (вместо него - фактически altq c HFSC планировщиком). Теперь выпилили все кодировки, кроме универсальной. Нормальная идеология - поддерживать будет проще.
Не понял. Текстового режима больше не будет, или видюхи научились поддерживать больше одного байта в кодировке?
Просто рассматривай набор символов в видюхе как шрифт, а не кодировку. Да, в этом шрифте мало символов. Но я всё равно не знаю ни одного шрифта, который бы умел весь юникод. Символы, отсутствующие в шрифте, выводятся как "квадраты" или вопросительные знаки, только и всего. То же самое можно сделать и в текстовом режиме.
> Текстового режима больше не будет,Технически, LCD - массив пикселей, столько-то на столько-то. У него нет понятия "1 символ". Это горбатая абстракция в легаси-режимах, для совместимости с MS-DOS и тому подобными.
>> Текстового режима больше не будет,
> Технически, LCD - массив пикселей, столько-то на столько-то. У него нет понятия
> "1 символ". Это горбатая абстракция в легаси-режимах, для совместимости с MS-DOS
> и тому подобными.Для совместимости с алфавитом имени Кирилла и Мифодия... Ага. Современные макаки однако стремительно прогрессируют. Вдаль от этих "горбатых" никому не нужных букв...
> Для совместимости с алфавитом имени Кирилла и Мифодия...Чудная логика. Ну конечно, было намного лучше разговаривать с компьтером при помощи тумблерова и лампочек, ассемблировать на листочке бумаги и все такое.
> Ага. Современные макаки однако стремительно прогрессируют.
А я то думал - что за странная у вас логика. А это, оказывается, прогресс добрался до макак...
>Технически, LCD - массив пикселей, столько-то на столько-то. У него нет понятия "1 символ".У CRT тоже нет символов
> У CRT тоже нет символовИ болт с ним. У него и пикселов как таковых нет. Ну то-есть на маске кинескопа триады пикселей, конечно же, есть. И даже их число конечное. Но вот точность прицеливания лучом очень приблизительная (и разная от центра к краям). Поэтому там говорить о нативном разрешении сложно. А вот LCD - прибор точный. У каждого пикселя по своему транзистору. И с каждой стороны матрицы отведено по выводу. Вот там нативное разрешение - вполне конкретный параметр. Да и "видеокарта" становится понятием достаточно условным. Ну то-есть к чипам разводящим сигнал по сторонам матрицы может идти некий цифровой интерфейс. И никакой "карты" может и не быть. Скажем небольшие LCD подключаются к "микропроцессорной шине", "RGB-bus", и прочая. А всякие LVDS и HDMI - нечто типа сериализованного представления того же самого.
И как я теперь из под Опёнки буду свой ДОС запускать?
> И как я теперь из под Опёнки буду свой ДОС запускать?Это Вы так под ДОС сеть или память подкладываете?
В DOS была своя система локализации, во FreeDOS, наверное, тоже есть своя. В dosemu это работало, независимо от локали основной системы.
UTF-8 это не локаль, а кодировка. Локаль это C, POSIX, ru_RU, en_US и т.п., профанский заголовок.
А ru_RU - это не локаль, а язык и страна. Вот ru_RU.UTF-8 - это локаль. И новость о том, что _локали_, не использующие кодировку UTF-8, больше не будут поддерживаться. Это не значит, что остальные кодировки перестанут поддерживаться везде, только в локалях.
опенок как то взлез не вовремя, утянул на себя все каменты про утф8 с соседней новости про фряху 10,2 =D
Можно же и так написать:
LANG=ru_RUТак что "В OpenBSD будет удалена поддержка всех локалей," звучит как-то не очень корректно. "... всех кодировок локалей," было бы лучше.
Юникод - это временный костыль до перехода к единому алфавиту.
它是正確的
Для такого можно сделать ТеХ-образые обозначения.
> Для такого можно сделать ТеХ-образые обозначения.А с латиницей-то что делать будем?
1. неалфавитные языки типа иероглифов сразу выпилить, у них нет будущего2. разделение на большие и маленькие буквы выпилить из грамматики и символьного набора, оставить как атрибут шрифта типа жирный/наклонный/подчёркнутый
3. всякие пиктограммы нафиг, псевдографику при наличии места можно оставить (хотя mc-образные интерфейсы делали и без неё)
В один байт влезет и латиница, и кириллица, и даже греческий.
> В один байт влезет и латиница, и кириллица, и даже греческий.А как насчет математических символов, например?
TeX - это наше всё.
То есть вместо набора символов вы предлагаете набор ключевых слов?
Для формул одних только дополнительных символов всё равно не хватит, а большинство азиатов и так пользуются обычными клавиатурами.
> большинство азиатов и так пользуются обычными клавиатурамиС этого места поподробнее.
> TeX - это наше всё.Так не пойдет. С таким же успехом можете читать неразобранный HTML вместо коментов.
Ну вот на опеннет можно СЕЙЧАС постить математические символы: "для ∀ лектора ∃ вектор..." ;). А сферические кейворды в вакууме - это круто. Но вот самому их парсить как-то не того. Браузер их не зарендерит. Да и математики врядли сильно хотят изучать какой-то внутренний язык какой-то софтины вместо оперирования привычным им языком формул. Который зело старше компьютеров и который можно как бы и уважить. Что в уникоде и сделали.
>> TeX - это наше всё.
> Так не пойдет. С таким же успехом можете читать неразобранный HTML вместо
> коментов.
> Ну вот на опеннет можно СЕЙЧАС постить математические символы: "для FA лектора
> TE вектор..." ;). А сферические кейворды в вакууме - это круто.
> Но вот самому их парсить как-то не того. Браузер их не
> зарендерит. Да и математики врядли сильно хотят изучать какой-то внутренний язык
> какой-то софтины вместо оперирования привычным им языком формул. Который зело старше
> компьютеров и который можно как бы и уважить. Что в уникоде
> и сделали.Чушь.
Во-первых браузер зарендерит. При, конечно, необходимости. Сейчас вон оно и pdf умеет вроде бы. До поддержки Уникода браузер и сопутствующие средства имеющие отношение к рендерингу всё равно нужно дорабатывать.
Сравнивая TeX с Уникодом, сравнивать надо коды Уникода и символьное представление TeX. После этого можете оценить высказывание. Про преимущества заучивания кодов Уникода, как кодировки какого-то там браузера (и изображения с их помощью потом формул), по сравнению с представлением в TeX.
В третьих OpenBSD - не браузер. И вопрос о кодировке в веб (сети), с которой должен иметь дело браузер - это отдельный вопрос конкретно браузеров. Как и отображение HTML...
> Во-первых браузер зарендерит.Да вот не рендерит что-то.
> Сейчас вон оно и pdf умеет вроде бы.
Еще как умеет. Аж файлы сливает АНБшникам через 0-day дыру.
> До поддержки Уникода браузер и сопутствующие средства имеющие отношение
> к рендерингу всё равно нужно дорабатывать.Браузеры умеют уникод уже много лет. В отличие от TeX. Поэтому дорабатывать их уже не надо.
> Сравнивая TeX с Уникодом, сравнивать надо коды Уникода и символьное представление TeX.
А как по мне - язык используемый математиками ничем не хуже кучи иных языков. И поэтому логично что типовые символы тоже попали в уникод. А желающие видеть весь мир через призму 256 символов - флаг им в руки...изобрести машину времени и свалить в 80-е. А в 2015 этот номер не пройдет. В 2015 совершенно нормально например писать на 3 разных языках. А вот мумукаться с самоличным указанием какие это были кодировки - нифига не нормально. И уникод может обеспечить корректное отображение без поимение мозга вопросом какая там была кодировка - KOI8R или 1251? А может, CP866? Или даже самый стандартный и всеми забытый 8859? :)
> После этого можете оценить высказывание. Про преимущества заучивания кодов Уникода,
А их совершенно не обязательно заучивать. Есть программы таблиц символов, например. Позволяющие копипастить что угодно, из любого блока уникода. Ну то-есть часто используемые логично запомнить или назначить на них хоткеи, вплоть до того что уникодный русский язык может печататься в терминалке при простом нажатии кнопок клавы. А редко используемые запоминать глупо.
И да, программа "отображение блоков уникода" - явно проще чем "рендерер формул TeX и справочник по синтаксису".
> как кодировки какого-то там браузера (и изображения с их помощью потом формул),
> по сравнению с представлением в TeX.TeX - некое внутреннее представление одной конкретной программы. Знаете, когда некто пишет текст для веба - он нынче может и не иметь представление о HTML. А математики точно так же не хотят знать какой-то левый птичий язык. У них уже есть свой язык. Существовавший задолго до компьютеров. И их он устраивал, между прочим.
Вижу ещё порцию собачьей чуши... Нагенерировали...
>> Во-первых браузер зарендерит.
> Да вот не рендерит что-то.
>> Сейчас вон оно и pdf умеет вроде бы.
> Еще как умеет. Аж файлы сливает АНБшникам через 0-day дыру.
>> До поддержки Уникода браузер и сопутствующие средства имеющие отношение
>> к рендерингу всё равно нужно дорабатывать.
> Браузеры умеют уникод уже много лет. В отличие от TeX. Поэтому дорабатывать
> их уже не надо.Не умеют. И в ряде случаев даже то, что вы наберёте не сможет отобразиться. Даже если отобразится у вас.
>> Сравнивая TeX с Уникодом, сравнивать надо коды Уникода и символьное представление TeX.
> А как по мне - язык используемый математиками ничем не хуже кучи
> иных языков. И поэтому логично что типовые символы тоже попали в
> уникод.Мы здесь не обсуждаем, какие символы логично чтобы попали в Уникод по-вашему. Хотя да, логично, что попали.
> А желающие видеть весь мир через призму 256 символов -
> флаг им в руки...изобрести машину времени и свалить в 80-е. А
> в 2015 этот номер не пройдет. В 2015 совершенно нормально например
> писать на 3 разных языках. А вот мумукаться с самоличным указанием
> какие это были кодировки - нифига не нормально. И уникод может
> обеспечить корректное отображение без поимение мозга вопросом какая там была кодировка
> - KOI8R или 1251? А может, CP866? Или даже самый стандартный
> и всеми забытый 8859? :)Теперь у вас есть вопрос - то ли это cp 866, то ли 1251, то ли 8859, то ли Уникод (а там то ли utf 8, то ли ещё...)...
И попутно замечу, что шлю я вас отнюдь даже не в 80-е... Вместе с тем, что вы понапишете. На 3х языках... :-)
>> После этого можете оценить высказывание. Про преимущества заучивания кодов Уникода,
> А их совершенно не обязательно заучивать. Есть программы таблиц символов, например. Позволяющие
> копипастить что угодно, из любого блока уникода.Началось. Программы видите ли. Мы про программы для работы, или про Уникод с TeX? Программ много. Для формул. И сгенерировать символ в TeX не сложнее, чем в Уникоде. На самом деле проще. Потому что можно и без спецпрограмм и спецподдержки.
> Ну то-есть часто используемые
> логично запомнить или назначить на них хоткеи, вплоть до того что
> уникодный русский язык может печататься в терминалке при простом нажатии кнопок
> клавы. А редко используемые запоминать глупо.О. Даже вплоть до того, что даже русские буквы просто при нажатии кнопок отпечатаются? :-) Ну, одолжение наконец сделали...
> И да, программа "отображение блоков уникода" - явно проще чем "рендерер формул
> TeX и справочник по синтаксису".Ещё раз. Чушь собачья. Сучья я бы даже сказал.
>> как кодировки какого-то там браузера (и изображения с их помощью потом формул),
>> по сравнению с представлением в TeX.
> TeX - некое внутреннее представление одной конкретной программы.Вообще-то нет. TeX вполне может существовать и сам по себе, если нормальные тексты поддерживаются. Хотя с программой конечно лучше.
> Знаете, когда некто пишет
> текст для веба - он нынче может и не иметь представление
> о HTML. А математики точно так же не хотят знать какой-то
> левый птичий язык. У них уже есть свой язык. Существовавший задолго
> до компьютеров. И их он устраивал, между прочим.Он и без Уникода отлично существовал. При чём здесь Уникод. Уже писал про заучивание кодов.
И кодировки с математическими символами есть неуникодовские. И кодировки с более чем 256 символами существуют не только уникодовские. И необходимость в них тоже может быть.
Короче говоря, нужнее от этой новости OpenBSD не стала. Вот и всё.
Кириллику тоже можно выпилить, у нее нет будущего.
у тебя походу тоже))
Ага, китайцам расскажи, что их письменность не имеет будущего.
> Ага, китайцам расскажи, что их письменность не имеет будущего.Вполне себе имеет будущее на 1/6 части суши и "арктическом шельфе".
>> Ага, китайцам расскажи, что их письменность не имеет будущего.
> Вполне себе имеет будущее на 1/6 части суши и "арктическом шельфе".Что за чушь? Китай вообще не ведет завоевательных войн уже бог знает сколько, а русский язык вытесняет все языки на территории своего господства. Спроси первого встречного чуваша, марийца, осетина, помнит ли он «свой» язык? Что касается китайского, откуда же по интернетам смищные картинки про магазины «Аптека Саша», «Колготки Вася»? Китайцы по возможности пользуются русским языком там, где им выгодно, а на территории России это как раз выгодно, китайский там нихрена не понимают.
1. Китай не намерен отказываться от иероглифов, т.к. общая письменность там цементирует государственность. Т.н. «диалекты» невзаимопонятны, и при переходе к алфавитному письму неизбежно произойдет всплеск национализма и сепаратизма по всему югу страны.2. Так тебя все и послушали. Не нравятся заглавные — учи грузинский, там их нет.
3. Юникод существует чтобы фиксировать всё человеческое наследие, используя электронную форму. Поэтому-то в него и предполагается включать всё что можно, даже египетские иероглифы и шумерская клинопись.
> В один байт влезет и латиница, и кириллица, и даже греческий.Погугли, наверняка такие эксперименты уже были во времена однобайтовых кодировок.
Алфавит - он сам по себе костыль. DRMов не напихаешь (а то взяли моду читать бесплатно!), опять таки передачу вредного вольнодумства от человека к человеку пресекать как-то надо. Поэтому переходить следует не к всемирному алфавиту, который по молодости и недомыслию предлагает коллега, а сразу к защищённым машиночитаемым бинарным кодам, которые будут исключительно визуализировать контент для авторизованного пользователя - причём в единственно правильном ключе, исключая такую вредную, неконтролируемую вещь, как воображение. В сочетании с BigData и Google AdSense это будет окончательным пришествием дивного нового мира невиданных возможностей и долгожданной изотропности человеческого материала, общества, культуры.
А может проще того, по пропускам интернет раздавать. А пропуска только кому положено выписывать. Как в Мьянме делают, например.
И симка там тысяч 100 рублей стоила + очередь несколько лет. И никакой цензуры не надо, пишите что хотите, у кого есть )) Поймают за либерастией и стремлением к еврогейским ценностям - посодют или расстреляют по выбору.
И вы знаете, эти ребята в чём-то правы...
Не-не. Ограничение доступа к информации - это каменный век, и посоны на планете не поймут. Это же неизящно получается. Надо демократично, современно, чтобы доступ к информации был у всех, даром, но никто не мог ею воспользоваться. А если объявить языки/алфавиты пережитком прошлого, излишней фрагментацией и оверхедом и вообще ненужным крапом, как тот же SysV init и протолкнуть под шумок что-нибудь а-ля латиницы как универсального алфавита, оруэлловского новояза или на худой конец systemd - вот тогда получится хорошо. Вангую, что первым президентом объединённой Земли будет небезызвестный Леннарт Поттернинг - у него богатый опыт в этом деле.
> И вы знаете, эти ребята в чём-то правы...Странно что ты туда не переехал. Наверное отличная страна для жизни. Хотя какие-нибудь соседи могут и просто бегать с калашами и стрелять. Плевать хотев на все ценности кроме материальных, которые можно отжать.
Цензурно по этому поводу выразиться крайне сложно.Если бы они убрали поддержку языков, кроме американского английского, и то было бы лучше.
Ну расскажи, ретроградушка, какую недокодировку ты используешь и что имеешь против utf-8.
Аудитории подобные изменения явно не прибавят.
А опенок за расширением аудитории и не гонится. У него своя парадигма. И нужно отдать должное Тео, в рамках парадигмы OpenBSD он все делает правильно, нравится это кому-то или нет. Операционка, затачиваемая под безопасность не должна превращаться в монстра с кучей наследуемых зависимостей от мало кому уже нужных раритетов. А в рамках OpenSource никто не запрещает "допилить" свежий опенок под любую требуемую консоль, если уж очень приперло.
начал ты хорошо, но вот фразой "рамках OpenSource никто не запрещает "допилить" ты наплевал в душу если не всея Опеннету, то уж большей его части точно.:)
Что поделать. ISC license опенка, как ни крути, но все же пресловутые "рамки", как и прочие BSD, GPL и Apache. Уверен, что большая часть Опеннета как раз-таки это осознаёт.
P.S.Я верю в честность Президента
И в неподкупность постовых,
В повальный кодинг Опеннета…
В русалок верю, в домовых.
Ха-ха, какой кодинг?
Makeing максимум ))
> Ха-ха, какой кодинг?
> Makeing максимум ))Кто сказал "Наальный"? милиция!!
О! "идеология", "парадигма". Давай, набрасывай ещё "вумных" терминов!
А где ты увидел в его посте слово "идеология"?
Давно пора.
Глупое решение. Даже сейчас иногда требуется насильно переключиться в экзотическую локаль. По умолчанию конечно нужна UTF-8, но выпиливать то, что работает и не просит - это варварство. Поспешили лет на 5-10.
Очень правильное и своевременное решение. Уйдет проблема работы в консоли на сервере. Кто сталкивался, поймет.