Эмпирическое правило для интерпретации размера энтропии

У меня вопрос относительно интерпретации энтропии. Для каждого человека в моем наборе данных у меня есть строка/последовательность из 17 символов (лет). Меня особенно интересует, как много вариаций происходит за этот период наблюдения.

Я думаю об использовании пакета R TraMineR для расчета энтропии внутри последовательности для этого. Я знаю, что это можно нормализовать, чтобы максимальная энтропия стала 1 (минимум 0, очевидно). Мой вопрос заключается в том, есть ли какое-либо эмпирическое правило, чтобы сказать, что является высокой, а что низкой энтропией (например, как в случае коэффициентов корреляции). Например, является ли 0,4 высоким или низким значением?

Спасибо.


person user3620411    schedule 04.02.2016    source источник


Ответы (1)


Энтропия внутри последовательности сильно зависит от контекста. Чтобы решить, является ли энтропия одной конкретной последовательности высокой или низкой, я предлагаю сравнить ее с энтропией других последовательностей или, например, со средней внутриэнтропийной.

Точно так же среднюю энтропию внутри последовательности одной группы сравните со средней энтропией других групп. Таким образом, вы могли бы заключить, например, что женщины имеют более высокую профессиональную энтропию, чем мужчины.

person Gilbert    schedule 18.02.2016