« Это не из легких »

Майкл Кернс и Юрий Невмывака опубликовали немало статей на тему алгоритмической торговли и имеют значительное присутствие как в академических кругах, так и в финансовой индустрии (алгоритм поиска ликвидности Aqua от JP Morgan, который выполняет сделки по всему миру на 60 биржах, 30 темных пулов и 50 стран частично основан на их алгоритме RL).

В части этой статьи (4 - Прогнозирование движения цены на основе состояния книги заказов) обсуждается потенциал использования RL помимо оптимизированного исполнения сделок. Цель состоит в том, чтобы обнаружить и использовать торговые стратегии, основанные на автоматически изученных (торговых) политиках.

Дело не в том, чтобы просто снизить затраты на исполнение, а в том, чтобы сгенерировать альфу - чтобы узнать, когда и как торговать. Чтобы наложить некоторую структуру и разбить эту проблему на управляемые части, авторы создают смоделированные книги заказов на выборке из 19 акций (AAPL, GOOG, ORCL и т. Д.). В документе анализируется искусственно ограниченный вариант использования, чтобы точно определить потенциальное влияние изученной политики ML (покупка / продажа одной акции на средней точке спроса и предложения, удерживание в течение t секунд, затем продажа на средней точке, как а также обратное действие).

Состояние x представлено шестью характеристиками (спред между спросом и предложением, цена, интеллектуальная цена, торговый знак, дисбаланс объема спроса и предложения, подписанный объем транзакции).

Политика π (x) определяет, какое действие (покупка или продажа) предпринять в конкретном состоянии. Политика выбора более прибыльного действия (с более высоким вознаграждением) в данном состоянии изучается на тестовом наборе данных (2008 г.) и проверяется на данных по запасам 2009 г. для определения общей прибыльности.

Рисунок 4 (выше) показывает, что алгоритм изучил импульсные стратегии (более высокая частота покупок для функций, содержащих информацию о направлении; приличное направленное движение будет продолжаться). Во всех случаях политика изучает правильное нулевое действие.

Для более длительных периодов удержания политика изучает стратегии возврата (если цена пошла вверх, вы можете ожидать, что она пойдет вниз). Это можно объяснить прекращением торговли, которая подтолкнула цену вверх.

Здесь мы видим, что для периодов более 10 секунд происходит направленный дрейф i.t. становится трудно предсказать движение цены на более длительные периоды времени.

Транзакционные издержки вызывают серьезную озабоченность, поскольку даже максимальной прибыли может оказаться недостаточно в случае агрессивной торговли, то есть может быть недостаточно для покрытия разницы между ценой покупки и продажи. Авторы приходят к выводу, что относительно легко обнаружить точные предсказательные сигналы, но не настолько тривиально, чтобы их выгодно использовать.