Метрика, определяющая коллинеарность.
Введение:
Многие онлайн-ресурсы рассказывают о значении VIF, но лишь немногие рассказывают о математической интуиции, лежащей в основе VIF. Сегодня, ребята, мы будем разбираться в математике, лежащей в основе VIF.
Значение мультиколлинеарности:
Мультиколлинеарность означает наличие некоторой корреляции между независимыми переменными. Это не подходит для линейной регрессии, поскольку линейная регрессия предполагает отсутствие корреляции между независимыми переменными. Одним из способов обнаружения мультиколлинеарности является VIF.
Как рассчитывается ВИФ:
Предположим, что для нашей модели линейной регрессии 3 независимые переменные (X1, X2, X3) предсказывают одну зависимую переменную (Y). Чтобы вычислить мультиколлинеарность между независимыми переменными в модели, компьютер пытается подобрать линию наилучшего соответствия между X2, X3 и X1, предполагая, что X1 является зависимой переменной, а X2 и X3 — независимыми переменными. Затем он вычисляет для него R2 и вставляет приведенную ниже формулу для вычисления VIF для X1. Весь этот процесс повторяется для X2 и X3.
Как правило, если VIF ‹ 1, эта функция не коррелирует с другими независимыми переменными.
если 1‹VIF‹5, этот признак умеренно коррелирует с другими признаками.
если VIF > 5, эта функция сильно коррелирует с другими функциями.