Когда вы занимаетесь статистическими концепциями, всегда возникает путаница. Давайте подробно рассмотрим ковариацию и корреляцию в этой статье.

Первая полезная информация, которую вы можете получить из данных, - это то, как две переменные связаны друг с другом. С точки зрения непрофессионала, как одна переменная связана с другой переменной?

Ковариация и корреляция - два широко используемых термина в области статистики и теории вероятностей. Оба термина измеряют взаимосвязь и зависимость между двумя переменными.

Совместная дисперсия

Ковариация указывает направление линейной зависимости между переменными. Значения ковариации нестандартные (… может быть любым числом)

Ковариация дается формулой -

Корреляция

Корреляция измеряет силу и направление линейной связи между двумя переменными. Значения корреляции стандартизированы.

Корреляция дается формулой -

Мы можем количественно оценить силу взаимосвязи с помощью корреляции. Слабая корреляция имеет небольшое значение корреляции, тогда как сильная корреляция имеет большее значение. Вы можете получить коэффициент корреляции двух переменных, разделив ковариацию этих переменных на произведение стандартных отклонений тех же значений. Когда вы делите значения ковариации на стандартное отклонение, оно по существу масштабирует значение до ограниченного диапазона от -1 до +1. Корреляция описывает отношения и не зависит от масштаба данных.

Теперь давайте посмотрим на несколько различий между ковариацией и корреляцией -

Теперь давайте посчитаем и разберемся на примере, чтобы он оставался в нашей памяти.

Давайте рассмотрим простой пример: X и Y - две переменные.

Подставляя в уравнение ковариации, получаем,

Давайте проверим это на Python -

Теперь вычислим Ко-отношение,

Подставляя в уравнение Ко-отношения, мы получаем -

Давайте проверим это на Python -

Вывод -

Мы понимали ковариацию и корреляцию отдельно. Мы поэкспериментировали на примере. Затем мы сравнили с кодом Python.

Мы получили значение ковариации как 8, что является положительным числом (может быть любой положительной бесконечностью). И мы достигли коэффициента корреляции 0,97, что явно является сильной положительной корреляцией между X и Y.