Приложения машинного обучения сильно зависят от прогнозирования временных рядов. Прогноз цен на акции выделяется среди других временных рядов как один из самых увлекательных и потенциально прибыльных.
Как обсуждалось в предыдущей статье, все три метода прогнозирования — скользящее среднее, автоматический ARIMA и пророк — охватывали годовые прогнозы в дополнение к линейной регрессии, методу k-ближайших соседей и долговременной кратковременной памяти (LSTM). В заключение, LSTM легко превзошел все другие алгоритмы, изученные на сегодняшний день. Хотя прямое сравнение этих методов невозможно, их следует признать.
Вот что я думаю по этому вопросу.
Постановка задачи
Мы стремимся предсказать цену закрытия ETF Vanguard Total Stock Market (VTI) в определенный день, анализируя данные за предыдущие N дней. Один год – горизонт прогноза. В Yahoo Finance мы можем получить 3-летний исторический набор данных для VTI, охватывающий период с 25 ноября 2015 г. по 23 ноября 2018 г. Набор данных получается следующим образом:
Этот набор данных будет разделен на три сегмента: 60 % для обучающего набора, 20 % для проверочного набора и 20 % для тестового набора. Модель обучается с использованием обучающего набора, ее гиперпараметры настраиваются с помощью проверочного набора, а ее производительность оценивается с помощью тестового набора. Ниже приведена иллюстрация, показывающая, как измененная цена закрытия распределяется между наборами для обучения, проверки и тестирования.
Рекомендуется, чтобы 60% набора данных предназначалось для обучения, а 20% — для тестирования и проверки. Убедитесь, что текст сохраняет естественный человеческий тон, используя множество синонимов и гарантируя, что он отличается от своей первоначальной формы.
Наши стратегии будут оцениваться с использованием среднеквадратичной ошибки (RMSE) и средней абсолютной ошибки в процентах (MAPE). Пониженные значения обоих этих показателей необходимы для надежного прогноза.
Мы будем основывать наш прогноз на самом последнем наблюдаемом значении, используя подход конечного значения. Текущее скорректированное закрытие…