Почему финансовое машинное обучение не успевает

В последнее время, благодаря развитию как исследовательской, так и вычислительной мощности, мы стали свидетелями огромных успехов в области машинного обучения с приложениями, охватывающими такие области, как электронная коммерция, производство и транспорт. Настолько, что в некоторых узких случаях было доказано, что ИИ превосходит даже человеческие возможности. Интуитивно понятно, что как крупные, так и мелкие инвесторы также должны быть бенефициарами этой тенденции, поскольку среда богата данными, и простого упоминания об акциях достаточно, чтобы вызвать в воображении мысленные образы ценовых графиков со скрытыми моделями.

Однако на самом деле это не так. Не было никаких прорывных работ, которые взяли бы штурмом сообщество, все большему количеству инвестиционных менеджеров становится все труднее идти в ногу с индексом, не говоря уже о его превышении, и преобладающий портфельный подход по-прежнему остается парадигмой средней дисперсии. переданный нам финансовыми учеными прошлых лет. Таким образом, возникает вопрос, почему мы не наблюдаем широкого распространения ИИ в инвестициях?

В стране машин данные - король

Машинное обучение может дать нам набор инструментов, но поиск решения по-прежнему требует глубокого понимания проблемы. Многие эксперты сформулируют свою проблему прогнозирования как попытку спрогнозировать доходность акций. Это понятно, поскольку акции, возможно, являются наиболее доступным классом активов, а цены - наиболее заметным набором данных. Однако наборы данных финансовых временных рядов невероятно разнообразны, а отношение сигнал / шум симптоматично низкое. Спрашивать, почему, значит спрашивать о человеческом состоянии. Те, кто обнаруживают истинный сигнал, вынуждены торговать на нем, чтобы получить прямую финансовую выгоду. Трения или препятствия на пути к этому в нынешнюю эпоху относительно невелики. Однако по мере того, как реализуется больше сделок, мотивированных сигналами, и по мере распространения информации, базовые активы пересматриваются, часто до такой степени, что выгоды больше не перевешивают затраты (см. Риск). Сравните это с другой коммерческой проблемой, скажем, с системой рекомендаций, построенной на моделях потребительских расходов. Отношение сигнал / шум может быть более благоприятным в этих данных, поскольку само по себе понимание не может принести пригодной финансовой выгоды, по крайней мере, без предложения продукта и сайта электронной коммерции.

Однако это не означает, что машинное обучение не используется в инвестициях. Крупные искушенные инвесторы, такие как хедж-фонды и систематические управляющие фондами, уже давно используют машинное обучение в своих процессах. Фактически, один из самых успешных хедж-фондов Renaissance Technologies на одном этапе возглавляли ученые НЛП, в то время как другой гигант, Two Sigma, проводит конкурсы прогнозирования акций на веб-сайте науки о данных Kaggle. В другом месте запускается краудсорсинговая платформа Quantopian, позволяющая пользователям создавать и вносить свои собственные алгоритмы в ее фонды. Эта большая и хорошо обеспеченная категория участников собирала общедоступные наборы данных (такие как фундаментальные, ценовые и макроэкономические данные) до такой степени, что любой значимый сигнал не принимался во внимание. Те, кто хочет применить нестандартный алгоритм к готовому набору данных, окажутся жертвами крупных ошибок обобщения.

Это прекрасно понимают профессиональные инвестиционные менеджеры. Теперь акцент сместился с применения новых алгоритмов к данным, которые есть у каждого, на применение алгоритмов, имеющихся у каждого, к новым данным. Эти новые данные часто носят альтернативный и частный характер и могут включать (но не ограничиваются) спутниковые снимки, посещаемость и модели потребительских расходов. В этой новой парадигме данные являются основным товаром, и за это стоит огромная надбавка.

Означает ли это, что ИИ бесполезен для инвестирования?

Не обязательно, даже если методы прогнозирования машинного обучения с использованием традиционных показателей могут не работать, у нас все еще есть возможность переформулировать нашу проблему. Получение прибыли может быть конечной целью, но это не единственный важный фактор, не менее значимый для инвестора - это риск. В портфеле ценных бумаг это может проявляться в форме риска корреляции, таким образом, ML может быть полезным для получения информации о диверсификации портфеля. Другие области включают помощь в оптимизации торговых операций и затрат на перебалансировку, выявление закономерностей и улучшение хеджирования. Я буду подробно обсуждать некоторые из этих вариантов использования с соответствующим анализом и кодом в своих следующих сообщениях.

В заключение

В конечном итоге ML - это набор инструментов, набор проверенных алгоритмов, которые существуют десятилетиями, если не веками, при правильном использовании и в сочетании со знанием предметной области он может быть невероятно мощным. И наоборот, когда и если его применять неизбирательно, это приведет к неизбирательным результатам. Таким образом, вопрос должен быть не «Работает ли?», А должен быть «Правильно ли вы его используете?».

Отказ от ответственности: этот пост является исключительно выражением личных взглядов и мнений. Это ни в коем случае не является советом и не отражает точку зрения моего работодателя. Я использовал ИИ и машинное обучение как синонимы, заранее прошу прощения за всех, кого это может оскорбить.