- Неадекватность значений Шепли для объяснимости (arXiv)
Автор: Сюаньсян Хуан, Жоао Маркес-Сильва.
Аннотация: В этой статье приводится строгий аргумент в пользу того, почему использование значений Шепли в объяснимом ИИ (XAI) обязательно приведет к доказуемо вводящей в заблуждение информации об относительной важности признаков для прогнозов. Конкретно, эта статья демонстрирует, что существуют классификаторы и связанные с ними прогнозы, для которых относительная важность признаков, определяемая значениями Шепли, будет ошибочно придавать большее значение признакам, которые доказуемо нерелевантны для прогноза, и меньшее значение признакам, которые доказуемо релевантны. для предсказания. В документе также утверждается, что, учитывая недавние результаты сложности, существование эффективных алгоритмов для вычисления строгих значений атрибуции признаков в случае некоторых ограниченных классов классификаторов в лучшем случае следует считать маловероятным.
2. Аппроксимация значения Шепли без предельных вкладов (arXiv)
Автор: Патрик Колпачки, Виктор Бенгс, Эйке Хюллермайер.
Аннотация: значение Шепли, возможно, является наиболее популярным подходом для определения значимого вклада игроков в кооперативную игру, который в последнее время интенсивно используется в различных областях машинного обучения, в первую очередь в объяснимом искусственном интеллекте. Осмысленность обусловлена аксиоматическими свойствами, которым удовлетворяет только значение Шепли, что, однако, достигается за счет точного вычисления, экспоненциально растущего с количеством агентов. Соответственно, ряд работ посвящен эффективной аппроксимации значений Шепли, и все они вращаются вокруг понятия предельного вклада агента. В этой статье мы предлагаем с помощью SVARM и Stratified SVARM два непараметрических и независимых от предметной области алгоритма аппроксимации, основанных на представлении значения Шепли, отделенного от понятия предельных вкладов. Мы доказываем непревзойденные теоретические гарантии качества их аппроксимации и предоставляем удовлетворительные эмпирические результаты.