Последние разработки в области рекомендательных систем, часть 2 (искусственный интеллект)

1. Равный опыт в рекомендательных системах (arXiv)

Аннотация: мы исследуем проблему справедливости, которая возникает в рекомендательных системах. Необъективные данные из-за присущих определенным группам стереотипов (например, средний балл юношей по математике часто выше, чем по гуманитарным наукам, и наоборот у девушек) могут давать ограниченный набор предлагаемых заданий для определенной группы пользователей. Наш основной вклад заключается во введении нового понятия справедливости (которое мы называем равным опытом), которое может служить для регулирования такой несправедливости при наличии предвзятых данных. Понятие отражает степень одинакового восприятия рекомендаций по элементам в разных группах. Мы предлагаем структуру оптимизации, которая включает понятие справедливости в качестве члена регуляризации, а также вводим вычислительно эффективные алгоритмы, решающие оптимизацию. Эксперименты с синтетическими и эталонными реальными наборами данных демонстрируют, что предлагаемая структура действительно может смягчить такую несправедливость, демонстрируя при этом незначительное снижение точности рекомендаций.

2. Понимание или манипулирование: переосмысление онлайн-прироста производительности современных систем рекомендаций (arXiv)

Автор: Чжэнбан Чжу, Жунцзюнь Цинь, Цзюньцзе Хуан, Синьи Дай, Ян Юй, Юн Ю, Вэйнань Чжан.

Аннотация: Ожидается, что рекомендательные системы будут помощниками, помогающими пользователям находить нужную информацию в автоматическом режиме без явных запросов. По мере развития рекомендательных систем применяются все более сложные методы обучения, которые обеспечивают лучшую производительность с точки зрения показателей вовлеченности пользователей, таких как количество кликов и время просмотра. Однако повышение измеряемой производительности может иметь две возможные причины: лучшее понимание пользовательских предпочтений и более активная способность использовать ограниченную человеческую рациональность, чтобы соблазнить пользователя на чрезмерное потребление. Возникает естественный вопрос: манипулируют ли текущие алгоритмы рекомендаций пользовательскими предпочтениями? Если да, то можем ли мы измерить уровень манипуляции? В этой статье мы представляем общую основу для сравнительного анализа степени манипулирования алгоритмами рекомендаций как в сценариях с плановой рекомендацией, так и в сценариях с последовательной рекомендацией. Структура состоит из трех этапов: начального расчета предпочтений, обучения алгоритму и взаимодействия, а также расчета метрик, включающих две предлагаемые метрики: показатель манипулирования и изменение предпочтений. Мы тестируем некоторые репрезентативные алгоритмы рекомендаций как в синтетических, так и в реальных наборах данных в соответствии с предлагаемой структурой. Мы заметили, что высокий рейтинг кликов в Интернете не означает лучшего понимания первоначальных предпочтений пользователя, а заканчивается тем, что он побуждает пользователей выбирать больше документов, которые им изначально не нравились. Более того, мы обнаружили, что свойства обучающих данных оказывают заметное влияние на степень манипулирования, и алгоритмы с более мощными возможностями моделирования более чувствительны к таким воздействиям. Эксперименты также подтвердили полезность предложенных метрик для измерения степени манипуляций. Мы выступаем за то, чтобы будущие исследования алгоритмов рекомендаций рассматривались как проблема оптимизации с ограниченными манипуляциями с пользовательскими предпочтениями.

3. Библиотекарь кода: система рекомендаций по пакетам программного обеспечения (arXiv)

Автор: Лили Тао, Александру-Петре Казан, Сенад Ибраймоски, Шон Моран.

Аннотация: Использование упакованных библиотек позволяет значительно сократить цикл разработки программного обеспечения за счет повышения качества и читабельности кода. В этой статье мы представляем механизм рекомендаций Librarian для библиотек с открытым исходным кодом. Пакет библиотеки-кандидата рекомендуется для данного контекста, если: 1) он часто использовался с импортированными библиотеками в программе; 2) имеет аналогичную функциональность импортированным библиотекам в программе; 3) он имеет аналогичную функциональность реализации разработчика, и 4) его можно эффективно использовать в контексте предоставленного кода. Мы применяем современную модель, основанную на CodeBERT, для анализа контекста исходного кода, чтобы предоставить пользователям соответствующие рекомендации по библиотеке.

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning