Был разработан ряд приложений машинного обучения, в том числе возможность прогнозировать закономерности в данных временных рядов. Цены на акции, несомненно, являются одним из самых захватывающих (или прибыльных) временных рядов для прогнозирования.
Недавно я наткнулся на сообщение в блоге, в котором методы машинного обучения применяются для прогнозирования цен на акции. С точки зрения написания статья была хорошо составлена, в ней рассматривался широкий спектр методологий. Мне было трудно не чувствовать, что предмет требует более строгого подхода к академическому письму. Методы «Скользящее среднее», «Авто ARIMA» и «Пророк» отображали горизонт прогноза в год, в то время как «Долгосрочная кратковременная память (LSTM)», «k-ближайший сосед» и «Линейная регрессия» давали прогнозы, которые были значительно короче, чем один день. В конце статьи автор смело представил метод LSTM как превосходящий все предыдущие алгоритмы. Однако это утверждение было ошибочным, поскольку не было проведено справедливого сравнения.
В связи с этим сейчас я предложу свою точку зрения на этот вопрос.
Примечание. В соответствии с правилами новой среды я должен сказать, что никакая часть этой статьи не создана искусственным интеллектом, таким как бард или gpt. Весь контент здесь написан человеком.
Определение проблемы
Используя данные за предыдущие N дней (в частности, с горизонтом прогнозирования в 1 день), мы стремимся спрогнозировать ежедневные скорректированные значения закрытия ETF Vanguard Total Stock Market (VTI). В результате мы проанализируем исторические данные о ценах VTI за три года, охватывающие период с 25 ноября 2015 г. по 23 ноября 2018 г. Удобный способ получить этот набор данных — использовать Yahoo Finance. После загрузки набор данных выглядит следующим образом:
Всего 60 % набора данных будет использоваться для обучения, 20 % — для проверки и 20 % — для тестирования. По мере обучения модели параметры настраиваются с помощью проверочного набора, а производительность модели оценивается с помощью тестового набора. График скорректированной цены закрытия для поезда, проверки и тестовых наборов показан на прилагаемом рисунке.