The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

[apache-talk] [apache-talk] правильное поведение поисковика по сайту


<< Предыдущая ИНДЕКС Поиск в статьях src Установить закладку Перейти на закладку Следующая >>
Date: Tue, 5 Feb 2002 22:55:53 +0300
From: Alex Tutubalin <[email protected]>
To: [email protected]
Subject: [apache-talk] Re: [apache-talk] правильное поведение поисковика по сайту

> > транзакции - т.е. пока все изменения не произошли для собственно поисковика
> > индекс остается старым, либо же делать отдельную транзакцию для каждого
> > документа ?
> 
> А смысл? Зачем делать документ транзакцией - понятно.
Был бы смысл - я бы не спрашивал :)

То-есть смысл преследуется простой - если документ изменился, то это
ведет к delete from index; insert into index (update в этом месте
неприменим) т.е. в некоторый момент документа в индексе просто нет,
а это плохо.
Вторая причина - если коммитить реже, то это быстрее работает.

> > с lexa.ru скоро будет удален, равно как и Yandex.Site с apache.lexa.ru :)
> 
> А что -  fts так крут? Я на него посмотрел, мне стало интересно,
> но не настолько чтобы делать его альтернативным по отношению к многосерчу
> движком.

FTS - понимаем (по меньшей мере мной т.к. я присутствовал при создании
первых версий) - и это достаточная причина. 
Ну и по мелочи - хранится координатная информация (позиция слова в док-те)
- что позволяет, лучше сортировать результаты или сделать свой сортировщик,
используются R-деревья, которые на много порядков быстрее если в запросе
несколько слов.

Алексей Тутубалин
mailto: [email protected]

= [email protected] mailing list = Mail "unsubscribe apache-talk" to [email protected] if you want to quit. = Archive avaliable at http://www.lexa.ru/apache-talk =

<< Предыдущая ИНДЕКС Поиск в статьях src Установить закладку Перейти на закладку Следующая >>



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру