Я использую пакет тм.
У меня есть фрейм данных с двумя столбцами, первый столбец - это идентификатор, а второй столбец содержит текст. Датафрейм выглядит следующим образом.
Id Text
13456 Hi, Good morning
13457 How are you?
13456 May I know who I am speaking to?
13456 Hi, Good evening
Я использовал пакет tm, построил dtm и извлек 5 лучших слов для каждого документа, и это выглядит так:
Id Term1 Term2 Term3 Term4 Term5
13456 Hi Good morning term4 term5
13457 How are you term4 term5
13456 I Know may who to
13456 Hi Good Evening term4 term5
Но требуемый результат:
Id Term1 Term2 Term3 Term4 Term5
13456 Hi Good I morning evening
13457 How are you term4 term5
Я не смог найти никаких предыдущих вопросов, опубликованных по этому поводу. Заранее спасибо.