Проект GitHub подвел итоги конкурса по разработке метода классификации большого объема данных. Разработчикам было предложено на основе неполного лога просмотра пользователями репозиториев, сформировать для каждого пользователя список из 10 рекомендуемых репозиториев. Чем более точно автоматический метод подберет рекомендации (проверка производится по более полной, накопленной ранее статистике, главная задача - предсказать поведение пользователя), тем большее число баллов получит проект.
Список победителей и исходные тексты, предложенных ими методов классификации, можно найти на данной странице. Обзор тенденций, прослеживаемых в присланных на конкурс работах и самых интересных алгоритмов можно найти в статье "Collaborative Filtering with Ensembles".
|