The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Выпуск утилиты GNU grep 3.4, opennews (?), 03-Янв-20, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


26. "Выпуск утилиты GNU grep 3.4"  –2 +/
Сообщение от Аноним84701 (ok), 03-Янв-20, 15:28 
> riggrep написан на rust, не учитывает особенности unicode (u(ss)->ß)

Угу, то ли дело греп, на который еще не так давно (лет 6 назад) любители вставить "ß" затейливо матюкались  из-за принципиальных проблем поиска с умляутами.

% echo "THISS"|grep -ic "ß"                                                    
0

% echo "straße"|grep -ic "ss"                                                
0

% grep --version                                                              
grep (GNU grep) 3.3

Ответить | Правка | К родителю #12 | Наверх | Cообщить модератору

27. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Wilem (?), 03-Янв-20, 15:42 
В спеке на утф-8 сказано, что Eszett приравнивается к "ss"? Я такого найти не смог, более того на стековерфлоу сами немцы говорят, что с точки зрения языка Eszett *не равен* "ss", плюс у них вокруг этого переодически правила меняются. Также интересно - какое дело до обработки этого символа юзеру опеннета? Товарищ парсит в консоли немецкие логи?
Ответить | Правка | Наверх | Cообщить модератору

36. "Выпуск утилиты GNU grep 3.4"  +4 +/
Сообщение от Аноним84701 (ok), 03-Янв-20, 17:29 
> В спеке на утф-8 сказано, что Eszett приравнивается к "ss"?

Мне лень смотреть. Ведь это не я писал о том, что ripgrep "не учитывает особенности unicode (u(ss)->ß)".
Проще было проверить на практике – grep тоже как-то не очень учитывает (утф-8 используется по умолчанию)

> найти не смог, более того на стековерфлоу сами немцы говорят, что  с точки зрения языка Eszett *не равен* "ss", плюс у них вокруг этого переодически правила меняются.

Конечно не равен – вы не можете заменить любую двойную "ss" на ß.
А вот наоборот - (грубо говоря) всегда. Даже в деловой переписке это не будет чем-то уж слишком "из ряда вон".

Но да, стековерфлоу – это конечно авторитет! Куда тем же "Дойче Правописание [Правила]" (§25)  до мнения авторитетов 🙄
https://www.rechtschreibrat.com/DOX/rfdr_Regeln_2016_redigie...
https://www.duden.de/sprachwissen/rechtschreibregeln/doppel-...
> E2: Steht der Buchstabe ß nicht zur Verfügung, so schreibt man ss. In der Schweiz kann man immer ss schreiben. Beispiel: Straße – Strasse
> Если нет буквы  ß  - пишем ss. В Швейцарии  вообще можно всегда писать ss вместо ß.

.
> E3: Bei Schreibung mit Großbuchstaben schreibt man SS. Daneben ist auch die Verwendung des Großbuchstabens ẞ möglich. Beispiel: Straße – STRASSE – STRAẞE.
> Для заглавных/прописных букв используется SS. (Если в шрифте присутствует - старая формулировка до ввода "официальной" большой ß) прописная ß, то возможно написание с <большая ß>

Кстати, авторитеты не затрагивали проблему поиска в старых документах, где вместо isst, dass, wusste писали ißt, daß, wußte?

Небольшая подсказка насчет новых-старых правил:
Любителям умляутов (причем, вполне серьезным и уважаемым изданиям газет и журналов)  не впервой просто проигнорировать "блидинг-эдж" нововведения, вплоть до их отмены или серьезной переработки ;)
Да и благодаря таким "реформам" с отменами - до сих пор вполне нормально воспринимается старое правописание.

Ну и матюкались не на то, что ß не заменялось на "ss" при поиске, а на то, что ни ß, ни поиск öäü - вообще не работал толком:
http://www.knoppixforum.de/knoppix-forum-deutsch/sonstiges/t...
https://forum.ubuntuusers.de/topic/grep-findet-keine-umlaute...
https://bbs.archlinux.org/viewtopic.php?id=96082
(длинный список по запросу поисковика "grep umlauts")
А если задаться целью - то на грабли c умляутами до сих пор и на утф8 наткнуться можно:
https://stackoverflow.com/questions/24962147/grep-and-utf-8-...
https://stackoverflow.com/questions/49535221/how-to-grep-uml...

> Также интересно - какое дело до обработки этого символа юзеру опеннета? Товарищ парсит в консоли немецкие логи?

Мне лично - никакого.
Но критиковать ripgrep, тактично умалчивая о той же проблеме в grep --  немножечко отдает двойными стандартами.

Ответить | Правка | Наверх | Cообщить модератору

48. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Michael Shigorinemail (ok), 03-Янв-20, 19:44 
> Небольшая подсказка насчет новых-старых правил:

Ну вот, опять восхищаюсь Вашими тщательностью и кругозором :-)
Был бы рад знакомству.

PS: а может, в 2020 опеннетовку проведём хотя бы в Москве или Питере?

Ответить | Правка | Наверх | Cообщить модератору

52. "Выпуск утилиты GNU grep 3.4"  +1 +/
Сообщение от Аноним84701 (ok), 03-Янв-20, 20:08 
>> Небольшая подсказка насчет новых-старых правил:
> Ну вот, опять восхищаюсь Вашими тщательностью и кругозором :-)

Просто приходится много общаться с немецкоязычными, поэтому и разбираться с вывертами правописания  приходилось особо тщательно – так что это не кругозор, а скорее "сопутствующие спец. знания"  ;-)

> Был бы рад знакомству.
> PS: а может, в 2020 опеннетовку проведём хотя бы в Москве или Питере?

Лет 6-7 назад вполне. Сейчас, к сожалению, то семья, то здоровье "теребят".

Ответить | Правка | Наверх | Cообщить модератору

85. "Выпуск утилиты GNU grep 3.4"  +/
Сообщение от Anonymoustus (ok), 05-Янв-20, 11:46 
> переодически

Период, а не переод.

Ответить | Правка | К родителю #27 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру