1. Равный опыт в рекомендательных системах (arXiv)
Автор: Джэун Чо, Мунсок Чой, Чанхо Со.
Аннотация: мы исследуем проблему справедливости, которая возникает в рекомендательных системах. Необъективные данные из-за присущих определенным группам стереотипов (например, средний балл юношей по математике часто выше, чем по гуманитарным наукам, и наоборот у девушек) могут давать ограниченный набор предлагаемых заданий для определенной группы пользователей. Наш основной вклад заключается во введении нового понятия справедливости (которое мы называем равным опытом), которое может служить для регулирования такой несправедливости при наличии предвзятых данных. Понятие отражает степень одинакового восприятия рекомендаций по элементам в разных группах. Мы предлагаем структуру оптимизации, которая включает понятие справедливости в качестве члена регуляризации, а также вводим вычислительно эффективные алгоритмы, решающие оптимизацию. Эксперименты с синтетическими и эталонными реальными наборами данных демонстрируют, что предлагаемая структура действительно может смягчить такую несправедливость, демонстрируя при этом незначительное снижение точности рекомендаций.
2. Понимание или манипулирование: переосмысление онлайн-прироста производительности современных систем рекомендаций (arXiv)
Автор: Чжэнбан Чжу, Жунцзюнь Цинь, Цзюньцзе Хуан, Синьи Дай, Ян Юй, Юн Ю, Вэйнань Чжан.
Аннотация: Ожидается, что рекомендательные системы будут помощниками, помогающими пользователям находить нужную информацию в автоматическом режиме без явных запросов. По мере развития рекомендательных систем применяются все более сложные методы обучения, которые обеспечивают лучшую производительность с точки зрения показателей вовлеченности пользователей, таких как количество кликов и время просмотра. Однако повышение измеряемой производительности может иметь две возможные причины: лучшее понимание пользовательских предпочтений и более активная способность использовать ограниченную человеческую рациональность, чтобы соблазнить пользователя на чрезмерное потребление. Возникает естественный вопрос: манипулируют ли текущие алгоритмы рекомендаций пользовательскими предпочтениями? Если да, то можем ли мы измерить уровень манипуляции? В этой статье мы представляем общую основу для сравнительного анализа степени манипулирования алгоритмами рекомендаций как в сценариях с плановой рекомендацией, так и в сценариях с последовательной рекомендацией. Структура состоит из трех этапов: начального расчета предпочтений, обучения алгоритму и взаимодействия, а также расчета метрик, включающих две предлагаемые метрики: показатель манипулирования и изменение предпочтений. Мы тестируем некоторые репрезентативные алгоритмы рекомендаций как в синтетических, так и в реальных наборах данных в соответствии с предлагаемой структурой. Мы заметили, что высокий рейтинг кликов в Интернете не означает лучшего понимания первоначальных предпочтений пользователя, а заканчивается тем, что он побуждает пользователей выбирать больше документов, которые им изначально не нравились. Более того, мы обнаружили, что свойства обучающих данных оказывают заметное влияние на степень манипулирования, и алгоритмы с более мощными возможностями моделирования более чувствительны к таким воздействиям. Эксперименты также подтвердили полезность предложенных метрик для измерения степени манипуляций. Мы выступаем за то, чтобы будущие исследования алгоритмов рекомендаций рассматривались как проблема оптимизации с ограниченными манипуляциями с пользовательскими предпочтениями.
3. Библиотекарь кода: система рекомендаций по пакетам программного обеспечения (arXiv)
Автор: Лили Тао, Александру-Петре Казан, Сенад Ибраймоски, Шон Моран.
Аннотация: Использование упакованных библиотек позволяет значительно сократить цикл разработки программного обеспечения за счет повышения качества и читабельности кода. В этой статье мы представляем механизм рекомендаций Librarian для библиотек с открытым исходным кодом. Пакет библиотеки-кандидата рекомендуется для данного контекста, если: 1) он часто использовался с импортированными библиотеками в программе; 2) имеет аналогичную функциональность импортированным библиотекам в программе; 3) он имеет аналогичную функциональность реализации разработчика, и 4) его можно эффективно использовать в контексте предоставленного кода. Мы применяем современную модель, основанную на CodeBERT, для анализа контекста исходного кода, чтобы предоставить пользователям соответствующие рекомендации по библиотеке.