1. Более мощный условный выборочный вывод для обобщенного лассо с помощью параметрического программирования (arXiv)

Автор: Во Нгуен Ле Дуй, Ичиро Такеучи

Аннотация: Условный выборочный вывод (SI) интенсивно изучается как новая структура статистического вывода для гипотез, основанных на данных. Основная концепция условного SI заключается в том, чтобы сделать вывод обусловленным событием выбора, что позволяет сделать точный и достоверный статистический вывод, даже если гипотеза выбирается на основе данных. Условная СИ в основном изучалась в контексте выбора модели, такой как ванильное лассо или обобщенное лассо. Основным ограничением существующих подходов является низкая статистическая мощность из-за чрезмерной обработки, которая необходима для вычислительной способности. В данном исследовании мы предлагаем более мощный и общий условный метод СИ для класса задач, который можно преобразовать в квадратичное параметрическое программирование, включающее обобщенное лассо. Ключевая концепция состоит в том, чтобы вычислить непрерывный путь оптимального решения в направлении выбранной тестовой статистики и идентифицировать подмножество пространства данных, которое соответствует событию выбора модели, следуя по пути решения. Предлагаемый метод, основанный на параметрическом программировании, не только позволяет избежать вышеупомянутого основного недостатка чрезмерного кондиционирования, но также повышает производительность и практичность SI в различных отношениях. Мы провели несколько экспериментов, чтобы продемонстрировать эффективность и действенность предложенного нами метода.

2. Общие границы ошибок для обобщенного лассо с субэкспоненциальными данными (arXiv)

Автор : Мартин Гензель, Кристиан Кипп

Аннотация: В этой работе проводится неасимптотический анализ обобщенного Лассо в предположении субэкспоненциальных данных. Наши основные результаты продолжают недавние исследования эталонного случая (суб)гауссовых выборочных распределений и, таким образом, исследуют, какие выводы все еще актуальны при выходе за рамки. Хотя многие статистические характеристики остаются неизменными (например, согласованность и скорость затухания ошибок), ключевое различие проявляется в том, как измеряется сложность набора гипотез. Оказывается, ошибку оценки можно контролировать с помощью двух параметров сложности, которые естественным образом возникают из стратегии доказательства, основанной на обобщенной цепочке. Выходная модель может быть нереализуемой, тогда как единственным требованием к входному вектору является общее неравенство концентрации типа Бернштейна, которое может быть реализовано для множества субэкспоненциальных распределений. Этот абстрактный подход позволяет воспроизвести, унифицировать и расширить ранее известные гарантии обобщенного Лассо. В частности, мы представляем приложения к полупараметрическим моделям вывода и восстановлению фазы с помощью поднятого Лассо. Более того, наши результаты обсуждаются в контексте задач редкого восстановления и многомерного оценивания. △ Меньше