Анализ текста с Р.
Мой набор данных — 2000 комментариев из 2000 разных опросов. Я создал Биграммы. Я проверил частотность слов, затем кластерный анализ слов с hclust()
, затем ассоциацию Word с findAssocs
, например, findAssocs(bigram_dtm,"long time",0.2)
.
Например, я вижу, что «долгое время» имеет ассоциацию 0,66 с «ощущением ожидания».
Я пытался найти его в Интернете, но пока безуспешно... Вопросы: Можно ли как-нибудь напечатать комментарии, где эти биграммы собраны вместе? Можно ли как-нибудь напечатать комментарии там, где стоит «давно»?
Спасибо,