IBM Watson Personality Insights: использовать исходные или процентильные оценки?

Я использую IBM Watson Personality Insights в контексте академического исследовательского проекта.

Из проведенного до сих пор анализа я заметил, что часто есть большие различия между исходными и процентильными оценками для одних и тех же твитов, а в некоторых случаях оценки даже находятся на противоположных концах (например, исходная оценка согласия: 0,21 и оценка процентиля согласия 0,76). Более того, на агрегированном уровне для моей выборочной совокупности дисперсия внутри личностных черт намного выше для процентилей и очень низка для исходных оценок (все наблюдения в диапазоне 0,1-0,2 на черту).

Я понимаю, что процентили - это нормализованные оценки, и интерпретации оценок различаются. Мой вопрос в том, какая оценка обычно используется исследователями, которые стремятся применить их в регрессионном анализе (например, индивидуальные черты личности - успех)? В статьях, которые, как я видел, применяют Personality Insights, авторы не обсуждают, какой балл они используют. Было бы здорово, если бы у вас были некоторые мысли по этому поводу и вы могли бы поделиться любыми исследованиями, в которых более подробно обсуждается их подход с помощью Personality Insights.

Заранее большое спасибо за ваше руководство!


person dianesmith    schedule 07.09.2018    source источник


Ответы (1)


Вы правы, что оценки имеют разное толкование. Необработанные оценки - это как раз то, что, поскольку нормализованная оценка относится к большей совокупности. Хотя диапазоны для исходных оценок черты составляют от 0 до 1 на практике, это не всегда так, и оценки могут быть сосредоточены в более узком диапазоне. Вот почему в примере, который вы показываете выше, небольшое изменение исходной оценки может иметь гораздо большее изменение в процентиле.

Обратите внимание, что для расчета процентилей мы запускали профили для большей совокупности (100 тыс.), Где вы наблюдали бы эти тенденции, которые могут не отображаться в меньшей выборке.

Что касается вашего другого вопроса; Какой счет вы бы использовали, очень зависит. В целом, большинство используют процентиль, поскольку он дает вам представление о том, как данная группа людей сравнивается с населением в целом. Например, если мне интересно посмотреть, как одна группа сравнивается с другой, использование процентилей упрощает интуитивное понимание различий (разницу в согласии в 25% легче понять, гораздо легче понять, чем грубую разницу в 0,1. так как вы не узнаете, важно это или нет). С другой стороны, необработанные оценки используются в основном, когда вы создаете более крупную модель и используете оценку PI в качестве одной из функций. В этом случае обычно полезно использовать исходные оценки, поскольку вы делаете собственные выводы из более крупной модели.

person Neil Boyette    schedule 07.09.2018