Я создал скрипт для частоты слов в документе, используя объект и словарь documentTermMatrix в R. Скрипт работает с отдельными словами, а не с составным словом es. "фу" "бар" "фу бар"
Это код
require(tm)
my.docs <- c("foo bar word1 word2")
myCorpus <- Corpus(VectorSource(my.docs))
inspect(DocumentTermMatrix(myCorpus,list(dictionary = c("foo","bar","foo bar"))))
Но результат
Terms
Docs bar foo foo bar
1 1 1 0
Мне нужно было найти один "foo bar" = 1
Как я могу это исправить?