Мне немного неясны некоторые ошибки, возникающие при использовании пакета tm
.
Я знаю, что функция wordcloud
в пакете wordcloud
принимает в качестве аргумента корпус:
Как указано в документации: (слова, которые вы даете функции) могут быть либо вектором символов, либо Корпусом.
Все идет нормально.
Имея это в виду, у меня есть следующий простой код:
library(tm)
library(wordcloud)
corpus <-Corpus(DirSource("/.../MUSIC"), readerControl = list(language="lat")) readerControl = list(language="lat"))
a <- tm_map(corpus, removeWords, c(stopwords("en")), mc.cores=1)
Я хочу, чтобы эта следующая строка дала мне облако слов:
wordcloud(a)
но вместо этого я получаю следующую ошибку:
Error in simple_triplet_matrix(i = i, j = j, v = as.numeric(v),
nrow = length(allTerms), : 'i, j, v' different lengths
Я не уверен, почему корпус имеет неправильный размер. У меня сложилось впечатление, что корпус был приемлемым входом.
Есть ли у кого-нибудь понимание природы любой из этих ошибок, кто видел это раньше и, возможно, имеет некоторые идеи о различных обходных путях?
Заранее спасибо.
?wordcloud
работает и соответствует вашему рабочему процессу, это говорит мне о проблеме с данными. Используйтеinspect
, чтобы увидетьCorpus
. Возможно, отсутствуют данные, пустые строки. Что-то необычное. - person Tyler Rinker   schedule 18.04.2014