Многие процедуры вывода преследуют общую цель - минимизировать среднее значение или сумму квадратов ошибок. Это имеет грандиозную историю, восходящую к Гауссу, имеет интуитивный смысл и поддается анализу и расчету. Это ядро ​​аналитических методов от обычной линейной регрессии почти до всего машинного обучения и искусственного интеллекта.

В финансах это тоже заставляет нас делать ошибки! Почему это так и почему это то, о чем мы должны заботиться? Ответ приходит из понимания базовых допущений наших методов и очевидной неприменимости этих допущений к финансовым рынкам.

Все системы прогнозирования создают функцию наблюдаемых данных и используют ее для прогнозирования ненаблюдаемых данных. Сделанная ошибка оценивается и во время обучения используется для настройки функции прогнозирования с помощью некоторых параметров управления. В статистической обстановке мы обычно рассматриваем некоторые из этих параметров как «оценки» истинных значений вещей, которые имеют значение в математической модели природы. В машинном обучении и искусственном интеллекте мы игнорируем «значение» параметров (что на самом деле означают веса внутри искусственной нейронной сети?), Но они все еще существуют. В обоих случаях мы стремимся минимизировать некоторую совокупную меру непригодности модели для набора данных с известными ответами.

В статистике есть метод, называемый оценкой максимального правдоподобия (MLE), который предполагает, что мы хотим найти значения этих параметров, которые являются наиболее вероятной причиной данных, которые мы наблюдали, с учетом вероятностной модели для процесса генерации данных. Часто конкретный процесс генерации вероятностных данных имеет связанную с ним естественную функцию оценки, которая может быть получена с использованием метода MLE. Например, если ваши данные имеют неприятные толстые хвосты, они могут быть хорошо смоделированы распределением Лапласа, и из этого довольно просто показать, что вы хотите минимизировать среднюю абсолютную ошибку, а не среднеквадратичную ошибку - т.е. ваши данные требуют « Надежный Регресс .

Распределение вероятностей, которое говорит вам минимизировать сумму квадратов ошибок, представляет собой модель линейного аддитивного шума с гомоскедастичными (т. Е. Постоянной дисперсией), нормально распределенными ошибками.

Но вот проблема в финансах: существует довольно много неопровержимых доказательств того, что одно, что вы можете сказать о доходности фондового рынка с большой уверенностью, - это то, что обычно они не распределяются с постоянной дисперсией.

Хорошо, но это же всего лишь модель, не так ли? И как сказал Джордж Бокс: все модели неправильные, но некоторые модели полезны.

Вопрос в том, насколько вы неправы и каковы последствия того, что вы ошибаетесь? Когда ваш набор данных включает выброс в три или четыре стандартных отклонения, что не является чем-то необычным в контексте подгонки модели к финансовым данным, метод наименьших квадратов считает, что эта ошибка действительно, действительно, действительно, важно. И это искажает выбранные вами параметры, чтобы их не было. Это концепция «влияния» наблюдаемых данных. Каждая база данных по-разному влияет на общий выбор параметров в вашей модели, и не все они обрабатываются одинаково, когда используется неправильная функция оценки.

Реальные рыночные данные непостоянны, но демонстрируют сгустки высокой и низкой дисперсии, поэтому игнорирование этого свойства также означает, что вы уделяете гораздо больше внимания одним периодам времени, чем другим.

Это простой, но действительно важный момент: хотите ли вы соответствовать модели, которая будет верна в любое время или только во время финансового кризиса 2008 года?

Итак, какова хорошая модель доходности фондового рынка и существует ли она вообще? К счастью, да! Эмпирически ежедневная доходность хорошо согласуется с асимметричной моделью GARCH (1,1) с принципиально лептокуртотическим распределением вероятностей, такой как t Стьюдента или обобщенное распределение ошибок (о котором я подробно писал в другом месте). Это хорошо на протяжении многих десятилетий, и на данном этапе мне потребовалось бы серьезное изменение режима, чтобы прекратить его использовать. Просто проверьте, насколько лучше подогнанная гистограмма на графиках ниже!

Ok. Итак, возвращаясь к Джорджу Боксу, разве нормальная модель не полезна, даже если она неправильная? Да ... но он делает ошибки, которые не нужно делать, когда у вас есть инструменты (то есть современные компьютеры), которые действительно могут обрабатывать данные, должным образом учитывая реальный характер данных - вместо того, чтобы предполагать, что вы можете получить отказаться от использования принципиально сломанной (в данном контексте) модели независимо и идентично распределенного белого шума.

Я подобрал те же данные для ежедневной общей доходности SPY ETF, используя как линейную регрессию, так и гораздо более реалистичную модель для процесса генерации данных, о котором говорилось выше. «Альфа» -модель в обоих случаях одинакова - линейная аддитивная модель шума с однодневным сроком обращения. Член реверсии статистически значим в обоих анализах, но принимает разные значения (-6,7% для линейной регрессии и -4,0% для модели GARCH) и указывается как более статистически значимый при использовании менее реалистичного метода линейной регрессии - p -Значение члена линейной регрессии составляет 0,00000022, тогда как для более реалистичной модели это всего лишь 0,0015. Это важные отличия!

Графики выше показывают эффективность элементарной торговой стратегии вне выборки для обоих методов. Стратегия заключается в том, чтобы позиция была равна знаку ожидаемой доходности на каждый день: то есть, если вы ожидаете, что рынок пойдет вверх, тогда открывайте длинную позицию по одному контракту, а если вы ожидаете, что она пойдет вниз, то открывайте короткую позицию по одному контракту с сделки, совершенные на момент закрытия. Мы не предполагаем никаких транзакционных издержек, что уже не является нереалистичным предположением, и никакого влияния на рынок. Альфа, основанная на реалистичной вероятностной модели, имеет коэффициент Шарпа 1,4, тогда как одна альфа, основанная на линейной регрессии, имеет коэффициент Шарпа 0,8.

Ясно видно, что модель с более надежной оценкой работает лучше, и это сказывается на использовании правильного метода, а не на том, чтобы просто забегать вперед, предполагая, что минимизация среднеквадратичной ошибки «достаточно хороша».

Если вам понравилась эта статья и вы хотите прочитать больше моих работ, рассмотрите мою книгу Приключения в области науки о финансовых данных, которая доступна в виде электронной книги для Kindle, а также в Apple Books и Google Книги. Исправленное второе издание будет опубликовано World Scientific.



Вы также можете заказать мягкую обложку прямо у меня на нашем веб-сайте.



Вы можете напрямую поддержать мои статьи на Medium, подписавшись по этой партнерской ссылке.