Wordcloud в R без тм

Я пытался использовать Wordcloud без пакета «tm», так как он поддерживается в версиях 3.1 и выше, но в большинстве Linux-систем по умолчанию установлен R 3.0.8 (из репозитория apt). Поэтому я подумал преобразовать файл слов в data.frame в объект TermDocumentMatrix. Пожалуйста помоги. Если есть пакет помощи в 3.0.8, укажите пожалуйста.


person rjalfa    schedule 24.01.2015    source источник
comment
Я предлагаю вам прочитать отличное введение Мэтта Геммелла о том, как обращаться за помощью по техническим проблемам, которое можно найти здесь: whathaveyoutried.com. Я не хочу быть грубым, это на самом деле очень хорошо.   -  person Backlin    schedule 24.01.2015
comment
Также: Как сделать отличный воспроизводимый пример из SO R Часто задаваемые вопросы   -  person hrbrmstr    schedule 24.01.2015
comment
Почему бы вам просто не обновить R, если есть такое требование? Почти для каждого дистрибутива есть информация о том, как получить последние пакеты.   -  person hrbrmstr    schedule 24.01.2015
comment
Запускается ли пакет qdap в вашей системе, чтобы вы могли создать нужный tdm? Затем wordnet может преобразовать его в нужный ему матричный объект.   -  person lawyeR    schedule 24.01.2015


Ответы (1)


Помимо обновления R (через hrbmstr) или с помощью пакета qdap (через lawyeR), я бы рекомендовал пакет quanteda, который зависит от пакета wordcloud для простого создания облаков слов. Вы можете создать облако слов примерно так, где text_vector — это вектор текстов (или столбец из матрицы или фрейма данных):

library(quanteda)
my_dfm <- dfm(text_vector, ignoredFeatures = stopwords("English"))
plot(my_dfm)
person Joshua Rosenberg    schedule 28.12.2015