Если в вашем продукте есть поиск, фид или рекомендации, и вы хотите использовать машинное обучение для персонализации, вы можете бесплатно получить лучшие алгоритмы, размещенные ведущими компаниями, используя кредиты Y Combinator. Большинство реализаций этих алгоритмов с открытым исходным кодом находятся на https://recbole.io/. В противном случае используйте AWS Personalize, используя кредиты YC AWS.
Если вы не являетесь компанией Y Combinator, вы можете заключить сделку с AWS, Microsoft или Google. Даже за полную стоимость эти стандартные решения намного дешевле и качественнее, чем все, что 99% стартапов могут построить своими силами. Любое собственное решение следует протестировать на соответствие этим стандартным решениям, чтобы оценить реальную окупаемость инженерных инвестиций.
Самым современным в рекомендациях «низких данных» являются предсказатели последовательности элементов с использованием нейронных сетей, подобных HRNN. «Мало данных» означает «только клики и покупки». Это не то, что «ведущие компании», такие как Facebook или Pinterest, используют в производстве для рекламы, ленты или поискового рейтинга. Крупные компании используют решения «больших данных». Однако дух последовательности-предсказания-как-персонализации будет включен где-то в рекомендательную систему либо как часть сложной архитектуры НС, либо как преобразование признаков, используемое другими моделями.
Если вы переросли AWS Personalize, рассмотрите возможность инвестирования в инфраструктуру измерений и данных, а затем в операции машинного обучения, прежде чем приступать к сложному машинному обучению. Все оптимизированное должно быть сначала правильно измерено, и оно должно непрерывно работать без сбоев. Это вдвойне сложно, если ваш продукт развивается и есть коммерческий стимул играть с вашей системой, например, в электронной коммерции и особенно в рекламе. Всегда проверяйте свою модель на соответствие сглаженному прогнозу средней степени вовлеченности и сохраняйте этот простой прогноз доступным во время выполнения для обработки сбоев машинного обучения.
—
Лучшие решения для персонализации
AWS Персонализация: стандарт. Мы использовали AWS Personalize в качестве базовой системы совместной фильтрации. Все более сложное, что мы обучаем, должно превзойти AWS Personalize в автономной оценке, прежде чем мы приступим к производству. AWS Personalize может стоить несколько тысяч в месяц, которые вы можете оплатить кредитами Y Combinator на 100 000 долларов. Мы не видим, чтобы AWS Personalize превзошла базовую метрику популярности, если только не существует большого разнообразия элементов и большинство пользователей не являются постоянными пользователями. Средняя задержка составляет около 20–40 мс, но мы регулярно видим задержку >100 мс, поэтому вам понадобится запасной вариант для тайм-аутов.
Google AI и Google Remote Config Personalization: у Google есть фантастическое базовое решение для любого ML, которое вам может понадобиться. Персонализация удаленной конфигурации для Firebase охватывает большую часть инженерной работы по A/B-тестированию отдельных атрибутов. Опять же, вы можете оплатить их, используя кредиты Google YC на сумму до 100 000 долларов.
Microsoft Personalizer: я этим не пользовался, но похоже, что это AWS Personalize для Azure. У Microsoft нет сделки YC, но у них есть кредитная программа на 150 тысяч долларов для стартапов.
ByteDance (TikTok): используется в Азии. Юлонг Ченг является техническим руководителем и рад познакомиться с другими командами в США. У них еще нет контракта с YC, но они изучают его.
Известная компания Y «Рекомендовать» надстройки
Похоже, это предсказатели последовательности пользовательских событий. Amplitude интегрируется с вашей существующей аналитикой Amplitude, а Algolia интегрируется с вашим существующим поиском Algolia. Если вы уже используете один из этих двух продуктов, «рекомендуемое» дополнение принесет вам максимальную пользу от самостоятельного добавления чего-то вроде AWS Personalize.