1.1, vadiml (?), 13:22, 19/12/2007 [ответить]
| +/– |
> Переработанный механизм работы с UTF-8 строками
это, наверное, самое нужное, а то приходится на каждом углу указывать что используется utf8 и всё равно проверять правильно ли используется
| |
|
2.2, зю (?), 15:05, 19/12/2007 [^] [^^] [^^^] [ответить]
| +/– |
а где именно надо указывать?
я может что-то делаю не так, но ни в одном месте у меня нет указания на utf8 и все строки таковыми и остаются без каких-либо телодвижений.
юзаю бздю и линукс, правда, все окружение по возможности всегда utf8.
кстати, перл и выбрал из-за того что никакого гимора с юникодом.
| |
|
3.3, fennel (??), 16:16, 19/12/2007 [^] [^^] [^^^] [ответить]
| +/– |
А ты попробуй regexp с русскими буквами сделать. Классы русских букв не работают.
| |
|
4.7, 2l00p (?), 07:44, 21/12/2007 [^] [^^] [^^^] [ответить]
| +/– |
Linux a6m 2.6.18-4-k7 #1 SMP Mon Mar 26 17:57:15 UTC 2007 i686 GNU/Linux
LANG=ru_RU.UTF-8
LC_CTYPE="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_PAPER="ru_RU.UTF-8"
LC_NAME="ru_RU.UTF-8"
LC_ADDRESS="ru_RU.UTF-8"
LC_TELEPHONE="ru_RU.UTF-8"
LC_MEASUREMENT="ru_RU.UTF-8"
LC_IDENTIFICATION="ru_RU.UTF-8"
LC_ALL=
This is perl, v5.8.8 built for i486-linux-gnu-thread-multi
------------------
#!/usr/bin/perl -w
use encoding "utf8";
$_ = "Жизнь, она как жёрдочка в курятнике - короткая и вся в дерьме.";
s/\w{8}/СЛОВО/g;
print $_;
<>;
------------------
Всё отлично работает.
| |
|
3.4, angra (ok), 21:48, 19/12/2007 [^] [^^] [^^^] [ответить]
| +/– |
Поэкспериментируй с tr, например замени часть латинских букв вроде c,m,o,a на русские или наоборот.
| |
|
|
1.5, MicRO (?), 08:37, 20/12/2007 [ответить]
| +/– |
угу регулярка+utf был жескачь, нуна щас 5.10 потестить поглядеть как работает
| |
1.6, Stanislaus (?), 15:54, 20/12/2007 [ответить]
| +/– |
Ураа!
Новый switch воодушевляет.
given ($foo) {
when (/^abc/) { $abc = 1; }
when (/^def/) { $def = 1; }
when (/^xyz/) { $xyz = 1; }
default { $nothing = 1; }
}
Насчет плохой работы utf8:
use utf8; # чтобы указать, что исходник программы написан с использованием utf-8
# если данные поступают из неизвестного источника и Perl не может определить, что это utf-8:
# Используйте модуль Encode
# то есть, например, чтобы
my ($data) = $sth->fetchrow_array;
$data =~ s/морожное/пирожное/gi;
# сработало нормально, нужно указать Perl, что исходник в UTF-8, и скорее всего бит Unicode в $data не установлен.
use utf8;
use Encode;
...
my ($data) = map {Encode::decode('UTF-8',$_)} $sth->fetchrow_array;
$data =~ s/морожное/пирожное/gi;
| |
|