Нужно приблизительно подсчитать сколько времени за рабочий день пользователь провел на каждом сайте. Прокси сервер - squid.
Может есть готовые решения?Если готовых решений нет, то может кто подскажет алгоритм подсчета.
Я пока придумал следущее:
Каждый вход на сайт - это 10 мин проведенные на сайте (обозначим time_interval).
Создаю масив содержащий время конекта к сайту time_site.
Ищем диапазон елементов масива(time_site[start] - time_site[end]), в которых последовательные елементи меньше time_interval. Для этого промежутка время проведенное на сайте time_sum = time_site[end] - time_site[start] + time_interval.Объясню на примере:
time_site[1]=12:00
time_site[2]=12:02
time_site[3]=12:04
time_site[4]=12:06
time_site[5]=12:08time_site[6]=14:00
time_site[7]=14:02Тогда первый непрерывный интервал = 12:08 - 12:00 + 10 = 18 мин
второй непрерывный интервал = 14:02 - 14:00 + 10 = 12 мин
Итого 30 мин.Можна ли применять такой алгоритм? какие замечание по time_interval (Наиболее интересна такая статистика для развлекательных сайтов)?
"Каждый вход на сайт - это 10 мин проведенные на сайте" - откуда такая информация?В Squid регистрируется время обращения к сайту, а времени выхода нет.
Интервал между двумя операциями будет временем "убийства рабочего времени":
12-00 - 15-00 = 3 часа?
>"Каждый вход на сайт - это 10 мин проведенные на сайте" -
>откуда такая информация?10 мин - это пример. У меня это среднестатистическое время чтения страницы после открытия. Готов выслушать предложение по этому параметру
>
>В Squid регистрируется время обращения к сайту, а времени выхода нет.
>Интервал между двумя операциями будет временем "убийства рабочего времени":
>12-00 - 15-00 = 3 часа?Конечно что нет времени выхода. И быть не может. Поэтому и приходиться придумывать алгоритм подсчета.