Раскрытие информации из P-ценностей
Введение
В нашей предыдущей статье в блоге мы использовали линейную регрессию, чтобы предсказать стандартное отклонение следующего дня для акций SPY. Основываясь на этом, этот пост углубляется в оценку статистической значимости переменных-предикторов, используемых в модели. Понимая статистическую значимость, мы получаем ценную информацию о факторах, которые заметно влияют на прогноз целевой переменной. Наше обсуждение будет включать концепцию констант, p-значений и их роль в определении отношений между переменными.
Добавление постоянного столбца
Чтобы оценить статистическую значимость переменных-предикторов, мы начинаем с введения постоянного столбца в нашу модель линейной регрессии. Добавление постоянного столбца влечет за собой включение значения, которое остается неизменным независимо от других введенных факторов. Эта константа служит базой, которую необходимо учитывать при изучении влияния других переменных. Он обеспечивает отправную точку, с которой мы можем анализировать влияние дополнительных факторов.
Представьте, что вы анализируете факторы, влияющие на цену акции. Например, вы хотите понять, как такие переменные, как прибыль компании, рыночные тенденции и объем торгов, влияют на цену акций.
Чтобы ввести константу, вы присваиваете фиксированное значение 1 каждой точке данных в столбце констант. Постоянный член отражает среднее влияние на цену акции, когда все переменные-предикторы равны нулю или когда другие факторы, не включенные в модель, находятся на своих базовых уровнях. Мы хотим думать о постоянном значении, которое влияет на цену акции независимо от ее прибыли, объема торгов и т. д.
Измененные данные будут выглядеть так:
Включив постоянный столбец, мы можем лучше понять влияние других факторов на цену акций. Константа учитывает такие факторы, как внутренняя стоимость компании или общая стабильность рынка, которые постоянно влияют на цену акций. Постоянный столбец можно добавить с помощью библиотеки statsmodels (показано далее в этом посте).