Благодаря совершенствованию доступного в исходных текстах поискового механизма nutch (написан на Java и C++), в сети появились две открытые поисковые системы:
MozDex - 50 миллионов страниц в базе;
Objects Search - для подготовки и ранжирования результатов поиска используется Carrot2.
Следует отметить еще один, очень скромный на фоне nutch, открытый поисковый движок на Java - egothor.
PS. Для тестирования nutch используется индекс в 100 миллионов страниц.
|