В этой статье вы получите практическое объяснение того, что такое косинусное сходство.
Короче говоря, косинусное сходство измеряет, насколько что-то похоже.
Это «что-то» представлено векторами и может представлять собой множество разных вещей, таких как оценка, которую пользователь дает фильму, текст, как на изображении ниже, или история покупок пользователя.
Вычисление косинусного сходства может быть очень полезным при разработке систем рекомендаций,т.е. предложить пользователю фильм или товар в интернет-магазине.
Когда вы вычисляете сходство между двумя пользователями или двумя текстами, результат обычно находится между 0 и 1, поскольку угол векторов может достигать максимум 90 градусов — чем ближе к 1, тем больше сходство. Однако есть и другие приложения и случаи, когда косинусное подобие отрицательно, и поэтому угол больше 90 градусов.
Чтобы вычислить косинусное сходство между предпочтениями Алисы и Боба в отношении фильмов (с рейтингом 1–5), мы сначала должны определить фильмы, которые они оба оценили.
В нашем случае они оба дали оценку в Титаник и Нарнию, отмеченные розовыми квадратами.
Берем рейтинг Алисы в Титанике и Нарнии и умножаем его →(4*5).
Затем суммируйте это с умножением рейтинга Титаника и Нарнии Боба →(1*3).
Разделим приведенную выше сумму на квадратный корень из всех квадратов оценок, которые Алиса поставила → √(4² + 5² + 3²)
..умножить на все квадраты оценок, которые сделал Боб → √(1² +3² +5²)
После подсчета у вас есть косинусное сходство!
Чем ближе к 1, тем более похожи два пользователя.
Отказ от ответственности. Автор этой статьи не несет ответственности за любые ошибки или упущения в содержании этого сайта. Информация, содержащаяся на этом сайте, не гарантирует полноты, точности, полезности или своевременности.