Распределяется ли доход от акций обычно?

Соответствуют ли ожидания, основанные на распределении вероятностей, доходности акций в реальном мире?

Несмотря на боль, хаос на финансовых рынках в последнее время дает нам хорошую возможность подвергнуть сомнению наши предположения. В инвестиционной индустрии очень распространено моделирование потенциального диапазона будущей прибыли от инвестиций с нормальным распределением. Каждый раз, когда мы можем смоделировать что-то с нормальным распределением, это значительно упрощает жизнь. Например, доходность портфеля, состоящего из множества инвестиций (каждая с нормально распределенной доходностью), также обычно распределяется. А для описания инвестиции нам нужны только 2 значения: среднее (также известное как ожидаемая доходность инвестиций) и стандартное отклонение (также известное как риск инвестиции). Если мы хотим быть внимательными, мы должны также записать корреляцию инвестиций с нашим общим портфелем.

Ранее я писал о том, как финансовая отрасль моделирует риск инвестиций. Положение пика колоколообразной кривой по оси X представляет собой ожидаемую доходность, а ширина колоколообразной кривой указывает на ее риск:

Но действительно ли имеют смысл оценки риска, сделанные на основе этих предположений? Действительно ли доходность акций нормальна? И преуменьшает ли допущение о нормальности, должным образом или преувеличивает частоту рыночных катастроф (например, то, что мы испытали за последние несколько недель)?

Нормальна ли доходность акций?

С 1950 года средняя годовая доходность S&P 500 составляла примерно 8%, а стандартное отклонение этой доходности составляло 12%. Я хочу посмотреть на ежемесячные доходы, поэтому давайте переведем их на ежемесячные:

Monthly Expected Return = 8%/12 = 0.66%
Monthly Standard Deviation = 12%/(12^0.5) = 3.50%

Давайте наложим фактическую доходность на теоретическое нормальное распределение со средним значением 0,66% и стандартным отклонением 3,5%:

Это выглядит примерно нормально, но если мы посмотрим влево от распределения, то увидим знаменитые толстые хвосты. Жирные хвосты означают, что экстремальные события в реальности происходят чаще, чем можно было бы предсказать при нормальном распределении. Еще одним свидетельством этого является то, что фактическое распределение месячных доходностей S&P 500 в центре более тонкое, чем нормальное распределение. . Тонкая середина и толстые хвосты предполагают, что нормальное распределение не может быть лучшим описанием доходности акций. Скорее, кажется, есть 2 режима - спокойный режим, в котором мы проводим большую часть времени, которое обычно распределяется (но с более низкой волатильностью, чем 12%), и режим с высокой волатильностью и ужасной доходностью.

Еще один способ проверить нормальность - использовать график QQ (я также написал блог, в котором подробно описал, как работают графики QQ). Давайте посмотрим на график QQ для ежемесячной доходности S&P 500:

Отклонения от красной линии под углом 45 градусов представляют собой отличия от нормального распределения. Хотя большинство наблюдений в большей или меньшей степени попадает на красную линию, мы можем видеть значительные отклонения на левом хвосте и меньшие - на правом хвосте. Значение на оси X (теоретические квантили) говорит нам, как часто мы ожидаем увидеть наблюдение такой величины при нормальном распределении (это Z-баллы, также известные как стандартные отклонения от среднего, что подразумевает вероятность). А значение на оси Y (выборочные квантили, также в Z-оценках) говорит нам, как часто мы на самом деле это видим.

Например, возьмем две точки слева, которые являются очевидными выбросами. Оба они представляют доходность S&P 500 ниже -20%. Всего в наборе данных 843 ежемесячных наблюдения. Таким образом, 2 точки выбросов представляют собой всего 0,237% наших наблюдений. Мы можем использовать следующую строку кода, чтобы найти точку нормального распределения, в которой 0,237% наблюдений лежат слева:

In:
from scipy.stats import norm
# Multiply by 2 to account for probabilities in right tail also
theoretical_z_score = norm.interval(1-(0.00237*2))[0]
print('Theoretical Z = ' + str(round(theoretical_z_score, 2)))
Out:
Theoretical Z = -2.82

Это означает, что при нормальном распределении (со средним значением = 0 и стандартным отклонением = 1) мы ожидаем, что 0,237% наблюдений будут лежать слева от -2,82 (это значение является примером Z-балла). Z-оценка, которую мы только что рассчитали, представляет собой положение по оси X второй худшей доходности на графике QQ.

Мы можем подтвердить это с помощью кумулятивной функции плотности (метод CDF), которая сообщает нам для данного распределения сумму вероятностей, лежащих слева от Z-оценки:

In:
prob_left = norm.cdf(theoretical_z_score)
print('Probability to left = ' + str(round(prob_left, 5)))
Out:
Probability to left = 0.00237

Z-оценка

Z-оценка - это показатель, который связывает величины с вероятностями. Его формула:

Z-score = (observed - mean)/standard_deviation

Z-оценка -2,82 означает, что наблюдаемое значение было на -2,82 стандартного отклонения ниже среднего (чем дальше оно от среднего в любом направлении, тем менее вероятно наблюдение). -2,82 - это теоретический Z-показатель, также известный как значение, ниже которого мы ожидаем, что 0,237% наших наблюдений будут соответствовать нормальному распределению.

Теперь давайте посчитаем Z-оценку наших фактических данных. Две точки выбросов представляют собой катастрофическую ежемесячную доходность -20,4% (финансовый кризис 2008 г.) и -22,5% (в прошлом месяце). Таким образом, мы можем использовать -20,4% для расчета нашего Z-балла (поскольку 2 из 842 наблюдений имеют -20,4% или хуже) вместе со средним значением и стандартным отклонением месячной доходности S&P 500:

In:
actual_z_score = (-0.204 - 0.0066)/0.035
print('Actual Z = ' + str(round(actual_z_score, 2)))
Out:
Actual Z = -6.02

Вау, ежемесячная доходность -20% - это событие 6 сигм (на 6 стандартных отклонений ниже среднего)! Давайте сформулируем это в терминах вероятностей, которые нам будет легче понять:

  • Событие -2,82 сигма (или хуже) происходит с частотой 0,237%. Это означает, что мы ожидаем, что это будет происходить каждые 1 / 0,00237 месяца. Таким образом, мы ожидаем, что это будет происходить раз в 422 месяца или раз в 35 лет.
  • Событие -6,02 сигма (или хуже) происходит с частотой 8,87 * 10 ^ -8%. Да, это число для меня тоже не имеет смысла, так что давайте перефразируем его. С точки зрения лет, если бы доходность акций была действительно нормальной, то можно было бы ожидать, что событие 6 сигм, подобное этому, будет происходить каждые 93 884 861 год!

Вот почему график QQ особенно выделяет эти 2 точки (сигма -6,02 - это значение по оси Y второй худшей доходности на графике QQ). Он говорит о том, что мы наблюдаем в наших данных события 6 сигма (крайне маловероятные события) с гораздо более высокой, чем ожидалось, частотой (примерно 3 сигма). Он пытается сказать нам:

Это говорит о том, что мы наблюдаем в наших данных события 6 сигма (чрезвычайно маловероятные события) с гораздо большей, чем ожидалось, частотой (приблизительно 3 сигма). Он пытается сказать нам:

«Эй, основываясь на среднем и стандартном отклонении наших данных и, что наиболее важно, на предположении, что наши данные нормально распределены, то, что мы наблюдаем здесь, является супер-ненормальным!»

И мы наблюдали 2 доходности хуже -20%! Это 2 события типа «шесть сигм» (раз в 90 миллионов лет) в наборе данных, который рассчитан только на 70 лет. Таким образом, мы можем довольно уверенно заявить (проверка гипотез не требуется!), Что НИКАКАЯ доходность акций не является нормальной. Более того, если предположить, что они заставляют нас недооценивать вероятность катастрофической рыночной доходности.

И что теперь?

Мы отказываемся от всех наших моделей и пытаемся начать все с нуля? Я не думаю, что нам нужно идти до конца. В конце концов, доходность акций примерно нормальна, и многие преимущества теории инвестиций, такие как диверсификация, сохраняются даже в мире, где доходность акций ниже нормы и толстые хвосты (возможно, даже больше).

Но когда мы проводим стресс-тестирование наших портфелей (а также наших собственных мысленных ожиданий того, что может быть в будущем), мы определенно должны осознавать предполагаемые события 4, 5 и 6 сигм, которые на самом деле кажутся происходящими один раз в каждом бизнес-цикле.

Мы также можем специально переосмыслить то, как мы оцениваем частоту катастрофической рыночной доходности. Одна из проблем заключается в том, что финансовые рынки существуют недостаточно долго. Поэтому у нас недостаточно наблюдений, чтобы быть уверенным, что наши оценки среднего, стандартного отклонения и т. Д. Действительно репрезентативны для истинного распределения. Поэтому мы должны признать возможность того, что выводы, которые мы делаем (используя рыночные данные, которые у нас есть), иногда будут крайне неверными. Это немного напоминает мне прогноз землетрясений, когда ученые пытаются предсказать величину и частоту сильных землетрясений (подобные которым, возможно, никогда не регистрировались раньше), используя набор данных, в котором преобладают землетрясения небольшой и средней магнитуды. Возможно, финансовая отрасль сможет позаимствовать у них страницу или две.

Предыдущие сообщения, упомянутые в этой статье:

Понимание инвестиционного риска

Общие сведения о нормальном распределении

Что такое графики QQ?