URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID9
Нить номер: 4648
[ Назад ]

Исходное сообщение
"вычисление одинаковых строк"

Отправлено pheonix , 15-Сен-05 08:50 
есть файл около 150 мегабайт, в каждой строчке записана md5 файла, нужно найти одинаковые суммы, как это сделать есть ещё mySQL серве, может его туда ещё как-нитьприделать чтобы ускорить работу, кто нить сталкивался с таким?

Содержание

Сообщения в этом обсуждении
"вычисление одинаковых строк"
Отправлено pheonix , 15-Сен-05 09:42 
>есть файл около 150 мегабайт, в каждой строчке записана md5 файла, нужно
>найти одинаковые суммы, как это сделать есть ещё mySQL серве, может
>его туда ещё как-нитьприделать чтобы ускорить работу, кто нить сталкивался с
>таким?


:)))))
sort | uniq


"вычисление одинаковых строк"
Отправлено allez , 15-Сен-05 10:19 
>sort | uniq

Или "sort -u file".


"вычисление одинаковых строк"
Отправлено mthawk , 15-Сен-05 10:52 
>есть файл около 150 мегабайт, в каждой строчке записана md5 файла, нужно
>найти одинаковые суммы, как это сделать есть ещё mySQL серве, может
>его туда ещё как-нитьприделать чтобы ускорить работу, кто нить сталкивался с
>таким?

%md5s;
open (F,'filename')||die;
while (<F>)
{
chomp;
$md5s{$_}++;
}
close(F);
foreach (sort(keys(%md5s)))
{
print "$_ -> $md5s{$_}\n" if ($md5s{$_} > 1);
}


"вычисление одинаковых строк"
Отправлено madskull , 15-Сен-05 11:57 
>есть файл около 150 мегабайт, в каждой строчке записана md5 файла, нужно
>найти одинаковые суммы, как это сделать есть ещё mySQL серве, может
>его туда ещё как-нитьприделать чтобы ускорить работу, кто нить сталкивался с
>таким?

ну и я выскажусь :)
comm -23 <(sort file) <(sort -u file) | sort -u