Оценка усадки корреляции Спирмена R

Я пытаюсь оценить корреляционную матрицу доходности 50 акций в R. Я знаю, что должен уменьшить корреляционную матрицу, но меня также интересует использование ранговой корреляции Спирмена, поскольку она не требует, чтобы распределение было нормальный.

Для корреляции Спермана я обычно указываю метод = "spearman" в функции cov(), которая не допускает методов сжатия. Что касается усадки, я рассматривал пакет tawny и пакет corpcor, но они не допускают никаких спецификаций метода pearson/spearman и т. д.

Любые предложения о том, как я могу справиться с этой проблемой?


person eaoestergaard    schedule 03.04.2017    source источник
comment
Вы видели упаковку ShrinkCovMat? Из описания: Предоставляет непараметрические оценки усадки типа Штейна ковариационной матрицы, которые являются подходящими и статистически эффективными, когда количество переменных превышает размер выборки. Эти оценки неособые и хорошо обусловлены независимо от размерности.   -  person KoenV    schedule 03.04.2017
comment
Да и corpcor+tawn тоже. Однако при оценке корреляционной матрицы они, вероятно, не используют корреляцию Спирмена.   -  person eaoestergaard    schedule 04.04.2017
comment
Извините, но я не думаю, что смогу вам чем-то еще помочь. Я проголосовал за ваш вопрос, надеясь, что кто-то еще может вам помочь. Единственная ссылка, которая может вас заинтересовать, которую я нашел, это следующая. Он указывает на диплом бакалавра, посвященный усадке, и касается Спирмена: ссылка . Если эта статья вас заинтересует, вы можете связаться со студентом или сотрудником Pomona College.   -  person KoenV    schedule 04.04.2017
comment
Спасибо, посмотрю!   -  person eaoestergaard    schedule 05.04.2017
comment
Я пометил этот вопрос модератору, так как считаю, что это хороший вопрос, которому уделялось слишком мало внимания. Давай посмотрим что происходит. Удачи еще раз.   -  person KoenV    schedule 06.04.2017


Ответы (1)


Если вы заинтересованы в использовании непараметрической корреляции, возможно, вы можете взглянуть на тау Кендалла. Как U-статистика, она асимптотически нормальна. (Если я не ошибаюсь, Спирмен тоже асимптотически нормален, поэтому процедура, которую я собираюсь описать, действительна и для Спирмена). Следовательно, это предполагает, что вы можете использовать нормальное логарифмическое правдоподобие для выполнения вашего сжатия.

Точнее, пусть tau.hat будет вашей векторизованной (оценочной) корреляционной матрицей, а

L(tau | tau.hat, Sigma) = t(tau - tau.hat) Sigma^{-1} (tau - tau.hat)

где cov(tau.hat) = Sigma. L - это функция потерь, которая позволит вам узнать, когда вы применили слишком большую усадку (понимая, что L должно быть распределено примерно по хи-квадрат).

Это не очень полезно, поскольку вы не знаете Sigma, но есть способы ее оценки (для 50 акций это все еще может быть нормально, но это быстро взрывается). Это основная причина, по которой я предлагаю использовать тау Кендалла вместо ро Спирмена: вы можете иметь представление о его дисперсии (сигма). (См. эту статью для оценки Sigma: https://arxiv.org/abs/1706.05940)

Оттуда вы можете использовать стандартную технику для сжатия Sigma.hat (это необходимо), например. просто уменьшите его до диагональной версии Sigma0.hat ​​с помощью

Sigma.tilde = w Sigma0.hat + (1-w) Sigma.hat

с, скажем, w = 0,5. По крайней мере, убедитесь, что он положительно определен...

Затем (наконец-то!) получите уменьшенную версию tau.hat, позволив q перейти к 1 в tau.tilde = (1-q) tau.hat + q mean(tau.hat) до Prob[chi_d^2 > L(tau.tilde | tau.hat, Sigma.tilde)] = .05, где степени свободы для вашего хи-квадрата равны (?!?!?) d = length(tau.hat) - q.

Я не уверен, что степени свободы для квадрата хи верны. На самом деле, я почти уверен, что это не так. Обратите также внимание на то, что значение 0,05 было выбрано несколько произвольно. Суть в том, что вы, возможно, захотите взглянуть на статью, упомянутую выше, поскольку они (мы, я должен сказать) действительно уменьшают корреляционную матрицу Кендалла логарифмической доходности от 100 акций. То, как это делается, позволяет нам узнать больше о рассматриваемых степенях свободы (и не требует от вас предоставления структуры априори, поскольку он изучает блочную структуру из данных).

person Perochkin    schedule 15.03.2018