О режимах, оптимизации и компасе
В свои 20 лет я столкнулся с необычной возможностью для человека моего возраста. Вот он, подробный план на следующие два года, как я намеревался управлять огромной суммой чужих денег и в процессе строить несколько красивых зданий. Все укладывается в бюджет и сроки, которые я сам оценил. Все выглядело великолепно. Я чувствовал себя дирижером филармонического оркестра перед хорошо подготовленным концертом.
Возможность была необычной, так как этот уровень принятия решений находится не там, где вы обычно находитесь без гораздо большего опыта, и на то есть веская причина. Но это были сумасшедшие годы пузыря на рынке недвижимости, до 2007 года, добавьте пару случайных событий, и вот я, только с моими архитектурными исследованиями и «Очень большим танкером для сырой нефти», чтобы, так сказать, отплыть домой. Нервный? Не совсем. Настолько я доверял своим возможностям. Даже сегодня я улыбаюсь, вспоминая это.
Но даже если я был слишком самоуверен, я знал, что некоторые советы могут быть хорошими. Проблема заключалась в том, что было не так много людей, к которым я мог бы обратиться с доказанным успешным послужным списком в этой области. На самом деле был только один. Около 60 лет этот человек участвовал во всех битвах. После моего скромного обращения он согласился посмотреть, задал пару каверзных вопросов, вроде бы удовлетворился ответами. Я почувствовал облегчение, но затем последовала фраза:
«Но это не то, что произойдет, вам лучше сохранить это в настоящем»
- «Э-э, что вы имеете в виду, речь идет о предполагаемых сроках? ”
- «Нет, сроки разумные. ”
- «Так дело в бюджете, здесь кто-то ошибается в цифрах или, что еще хуже, вводит информацию в заблуждение? ”
- «Нет, наверное, все сообщают в соответствии со своими убеждениями», — я все еще не понимал.
- «Но этого просто не будет. Этого никогда не происходит. Вы не планируете покупать йогурт в магазине на углу. За два года все может и случится. Компании, законы, масштаб проекта, скрытые ограничения… все динамично. Ваш план является неполным черновиком. ”
Вам нужен лучший черновик с дополнительным слоем, вашим слоем. И тогда у вас будет компас и больше ничего…
- … компас для определения севера в ближайшие 2 года. Может показаться, что компас — это не так уж и много, но в этом масштабе больше некуда стремиться. Это поставит вас впереди большинства».
Разговор затянулся, и это был пример успешного «переносного обучения человека», которое хорошо обобщалось на многие ситуации в следующем десятилетии.
Хватит о прошлых жизнях. Как эта небольшая история связана с проблемой Zillow?
Как вы, наверное, знаете, к концу 2021 года Zillow сообщила об огромных потерях и сократила 25 % своей рабочей силы из-за того, что публикуется как провал «машинного обучения». Но я не думаю, что здесь виноваты алгоритмы.
Печальная правда заключается в том, что некоторые проблемы машинного обучения применительно к рынкам далеки от решения, а именно изменение режима (радикальное изменение концепции) и противоборственная активность. В его нынешнем состоянии машинное обучение можно рассматривать как оптимизацию и интерполяцию. Видите ли вы проблему этого инструмента для работы с ценовыми временными рядами?
На рынках иногда «дешево» (или любая другая характеристика) может означать «это выгодная покупка, покупайте сейчас», но также в другом режиме «дешево» может означать прямо противоположное: «завтра будет дешевле, продай как можно скорее!» ». Если режим определяется скрытыми факторами, то никакой Трансформатор LSTM вам не подойдет. Моделирование просто оптимизирует любую цель, которую вы определите для набора обучающих данных.
Другими словами, иногда рынки белые, а иногда черные, но если вы не можете сказать, какой из них применим, машинное обучение будет либо слепо делать ставку на один цвет, либо чаще оптимизировать серый для набора данных.
А как насчет онлайн-обучения? Не будет ли это лучше для борьбы со сменой режима? Ну, возможно. Но если характеристики не содержат информации о режиме, максимум, на что вы можете надеяться, — это минимизировать задержку реакции на основе структуры потерь последних наблюдений. Но оптимальность снова будет зависеть от обучающего набора данных и содержащейся в нем структуры изменения режима, так что вам лучше получить правильные данные!
Я хочу сказать, что, поскольку эти проблемы в настоящее время не решены, вы не можете полагаться на то, что модели будут вести себя хорошо при изменении рыночного режима.
Мы не должны называть «неудачей машинного обучения» то, что является ошибкой управления рисками.
Для меня убытки Zillow говорят не столько об «искусственном интеллекте», сколько о сложности управления рисками, когда вы человек.