Корреляция Пирсона в Python data.corr ()

У меня есть матрица следующей формы (20, 17), где строки - время, а столбцы - количество переменных.

Когда я вычисляю корреляционную матрицу, используя data.corr(), естественно, я получаю (17 , 17) матрицу.

Мои вопросы:

Есть ли способ нормализовать переменные directly в функции .corr()? (я знаю, что могу сделать это заранее, а затем применить функцию)

Моя корреляционная матрица велика, и у меня проблемы с просмотром всего за один раз (мне нужно прокрутить вниз, чтобы провести необходимое сравнение). Есть ли способ кратко представить результаты (например, тепловую карту), чтобы я мог легко определить самую высокую корреляцию от самой низкой?

Огромное спасибо


person bravopapa    schedule 05.11.2020    source источник


Ответы (1)


Вы можете использовать imshow() matplotlib, чтобы увидеть тепловую карту любой матрицы.

Кроме того, рассмотрите возможность использования фреймов данных pandas, чтобы вы могли отсортировать по силе корреляции и сохранить метки каждой строки и столбца.

person TYJJFL    schedule 05.11.2020
comment
Я делюсь кодом на случай, если есть интерес fig, ax = plt.subplots(figsize=(11, 9)) sb.heatmap(matrix) plt.show() - person bravopapa; 05.11.2020