Биология - Slope One - Фильтрация по схожести предметов и переобучение

19 мая 2011


Оглавление:
1. Slope One
2. Фильтрация по схожести предметов и переобучение
3. Коллаборативная фильтрация по предметам на основании статистики покупок
4. Коллаборативная фильтрация Slope One для предметов с оценками
5. Рекомендательные системы, использующие Slope One



Если доступны оценки предмета, к примеру, пользователям дана возможность проголосовать за предмет, то коллаборативная фильтрация пытается предсказать оценку, которую даст пользователь новому предмету на основании его предыдущих оценок и базы данных оценок других пользователей.

Пример: Можем ли мы предсказать оценку конкретного пользователя на новый альбом Селин Дион, если мы знаем, что он оценил The Beatles на 5 баллов?

В этом случае коллаборативная фильтрация по схожести предметов предсказывает оценку предмета на основе оценок другого предмета, используя чаще всего регрессионный анализ = ax + b). Следовательно, если имеется 1000 предметов, то может быть до 1000000 линейных регрессий для изучения и до 2000000 регрессоров. Такой подход может быть неэффективным из-за переобучения, поэтому необходимо выбирать пары предметов, для которых известны оценки нескольких пользователей.

Лучшей альтернативой может быть использование упрощённого предиктора = x + b): экспериментально показано, что использование такого простого предиктора иногда превосходит регрессионный анализ, при этом имея в два раза меньше регрессоров. К тому же у этого способа низкие требования к памяти и большая скорость.

Коллаборативная фильтрация по схожести предметов — это только один вид коллаборативной фильтрации. В случае использования коллаборативной фильтрации по схожести пользователей, анализируются отношения между пользователями, выясняется подобие их интересов. Но фильтрация по схожести предметов менее ресурсоёмка и имеет большую эффективность при наличии большого числа пользователей.



Просмотров: 12361


<<< Birds of a Feather (информатика)
User-generated content >>>