- Дополненные наивные байесовские классификаторы с деревом с ограничениями иерархических зависимостей для иерархических пространств признаков (arXiv)
Автор : Цен Ван, Алекс А. Фрейтас
Аннотация: Классификатор Tree Augmented Naive Bayes (TAN) представляет собой тип вероятностной графической модели, которая создает дерево зависимостей с одним родителем для оценки распределения данных. В этой работе мы предлагаем два новых алгоритма Байеса, основанных на иерархических зависимостях, а именно Hie-TAN и Hie-TAN-Lite. Оба метода используют заранее определенные отношения «родитель-потомок» (обобщение-специализация) между функциями как тип ограничения для изучения древовидного представления зависимостей между функциями, в то время как последний дополнительно устраняет иерархическую избыточность на этапе обучения классификатора. Результаты экспериментов показали, что Hie-TAN успешно добился более высокой производительности прогнозирования, чем некоторые другие алгоритмы классификации с ограничениями на иерархические зависимости, а его производительность прогнозирования была дополнительно улучшена за счет устранения иерархической избыточности, о чем свидетельствует более высокая точность, полученная с помощью Hie-TAN-Lite.
2. Улучшение производительности обычных классификаторов Наивного Байеса с помощью моделей на основе нейронного Байеса (arXiv)
Автор : Эли Азераф, Эммануэль Монфрини, Войцех Печинский.
Аннотация: Наивный Байес — популярная вероятностная модель, ценимая за свою простоту и интерпретируемость. Однако обычная форма соответствующего классификатора страдает двумя основными проблемами. Во-первых, поскольку он заботится о законе наблюдений, он не может учитывать сложные особенности. Более того, он учитывает условную независимость наблюдений с учетом скрытой переменной. В этой статье представлен оригинальный нейронный наивный байесовский метод, моделирующий параметры классификатора, индуцированные на основе наивного байесовского метода, с помощью функций нейронной сети. Это позволяет исправить первую проблему. Мы также представляем новые модели цепей Маркова с нейронным пулом, смягчающие условие независимости. Мы эмпирически изучаем преимущества этих моделей для анализа настроений, разделив частоту ошибок обычного классификатора на 4,5 на наборе данных IMDB с встраиванием FastText.