Системы рекомендаций, как и все в ИТ, имеют несколько разных определений, но мне больше всего нравится то, что дано в этом посте.

Эти системы помогают пользователям находить предметы, которые могут им понравиться.

Довольно просто и понятно. Когда вы читаете новости, смотрите фильм на Netflix или просто делаете что-то на Amazon, вы получаете сообщения вроде:

  • Вам это тоже наверняка понравится
  • Вместе с этим часто покупают
  • Товары, относящиеся к этому пункту
  • Клиенты, купившие данный продукт, также приобрели
  • Поскольку вы видели X, вам также может понравиться Y
  • Рекомендуется для вас

Что такое система рекомендаций?

Система рекомендаций — это подкласс систем фильтрации информации, который стремится предсказать рейтинг или предпочтение, которое пользователь может дать элементу. Проще говоря, это алгоритм, который предлагает пользователям релевантные элементы. Например: в случае Netflix, какой фильм смотреть, в случае электронной коммерции, какой продукт покупать, или в случае Kindle, какую книгу читать и т. д.

Случаи использования системы рекомендаций

  1. Персонализированный контент
  2. Улучшенный поиск товаров

Типы системы рекомендаций

1. Контентная фильтрация

Система рекомендаций, которая зависит от прошлого поведения пользователей на веб-сайте и сходства между элементами для создания списка рекомендаций, известна как система рекомендаций на основе контента. Он отслеживает все, что пользователь делает на веб-сайте, включая продукты, которые он нажимает, лайкает и время, потраченное на каждый продукт. Он также группирует все элементы на основе сходства. Например, одежда синего цвета относится к разделу «синяя одежда». Системы рекомендаций на основе контента работают лучше всего, когда организации необходимо избегать холодного запуска любых продуктов, которые они добавляют на веб-сайт. Поскольку эта система рекомендаций предлагает продукты на основе сходства, любой новый элемент, добавленный на веб-сайт, может быть указан в списке и рекомендован оттуда. Один из недостатков рекомендательных систем, основанных на содержании, заключается в том, что они требуют большого знания предметной области, чтобы сделанные рекомендации были точными на 100 процентов; большое знание предметной области означает, что организациям приходится покупать много места для хранения.

Пример:

Дженни смотрит «Мстителей», «Железного человека» и «Тора».

Теперь система рекомендаций будет искать похожие фильмы. Основой сходства между вышеперечисленными фильмами может быть то, что все они являются фильмами Marvel, а также боевиками.

Таким образом, системы рекомендаций будут искать фильмы, похожие на этот. Выяснилось, что сериалы «Черная пантера» и «Локи» — это как фильмы Marvel, так и боевики.

Итак, система рекомендаций порекомендует Дженни «Черную пантеру» и «Сериал Локи».

Преимущество

  • Модель не нуждается в данных других пользователей, так как рекомендации специфичны для одного пользователя.
  • Это упрощает масштабирование для большого количества пользователей.
  • Модель может фиксировать конкретные интересы пользователя и может рекомендовать элементы, которые интересуют очень немногих других пользователей.

Недостаток

  • Представление элементов элементов в некоторой степени создается вручную, эта технология требует больших знаний предметной области.
  • Модель может давать рекомендации только на основе существующего интереса пользователя. Другими словами, модель имеет ограниченные возможности для расширения существующих интересов пользователя.

2. Совместная фильтрация

Рекомендация новых элементов пользователям на основе интересов и предпочтений других подобных пользователей — это в основном совместная фильтрация. Например: – Когда мы совершаем покупки на Amazon, он рекомендует новые продукты с пометкой «Клиент, который принес это, также принес это», как показано ниже.

Это устраняет недостаток фильтрации на основе содержимого, поскольку вместо содержимого элементов, используемых пользователями, будет использоваться взаимодействие с пользователем. Для этого ему нужна только историческая производительность пользователей. Основываясь на исторических данных, с предположением, что пользователь, который соглашался в прошлом, склонен соглашаться и в будущем.

В широком смысле существует два типа методов совместной фильтрации, которые могут использоваться программным обеспечением и приложениями по всему миру. Они следующие: -

  • Совместная фильтрация на основе пользователей

Этот подход сужает круг пользователей с помощью совместной фильтрации, которая имеет сходное поведение, общие контакты, близкие демографические данные и сходное потребительское поведение. Сайты социальных сетей используют этот подход, чтобы рекомендовать пользователей другим пользователям на основе их моделей поведения.

Типичным примером такого подхода является категория «рекомендуемые друзья», отображаемая в Facebook. В этой категории рекомендуются люди, которых пользователи могут знать на основе их виртуальных контактов и аналогичных предпочтений.

  • Совместная фильтрация на основе элементов

Измеряя сходство между продуктами и выводя соответствующие рейтинги, товары рекомендуются пользователям на основе их исторических данных и интерактивной истории.

Преимущество

  • Это работает хорошо, даже если данных мало.
  • Эта модель помогает пользователям обнаружить новый интерес к данному элементу, но модель может по-прежнему рекомендовать его, потому что похожие пользователи заинтересованы в этом элементе.
  • Нет необходимости в знании предметной области

Недостаток

  • Он не может обрабатывать новые элементы, потому что модель не обучается на вновь добавленных элементах в базе данных. Эта проблема известна как проблема холодного запуска.
  • Побочная функция Не имеет большого значения. Здесь побочные функции могут быть именем актера или годом выпуска в контексте рекомендации фильма.

ПОКАЗАТЕЛИ ОЦЕНКИ

Поскольку мы обсудили различные типы рекомендательных систем, их преимущества и недостатки, но как мы можем оценить, рекомендует ли данная модель правильные вещи или нет, и сколько релевантных вещей предсказывает эта система, и вот метрики оценки.

  • Среднее Средняя точность при K
  • Покрытие
  • Персонализация
  • Интралистское сходство

В этом блоге было освещено множество тем, связанных с механизмами рекомендаций, такими как «Что это такое» и варианты его использования.