Вопросы по теме 'qdap'
транспонировать строку в столбец в R с помощью qdap
Я использовал функцию wfm в пакете "qdap" для транспонирования значений текстовой строки в столбцы и столкнулся с проблемой, когда данные содержат числа вместе с текстом. Например, если значение строки равно «abcdef», транспонирование работает...
175 просмотров
schedule
18.11.2021
Извлечение и подсчет общих пар слов из вектора символов
Как можно найти частые пары соседних слов в векторе символов? Например, при использовании набора данных по сырой нефти наиболее распространенными парами являются «сырая нефть», «рынок нефти» и «миллион баррелей».
Код для небольшого примера ниже...
3041 просмотров
schedule
11.09.2021
Поиск ассоциации между всеми терминами в матрице документа терминов — огромный размер
У меня есть требование найти корреляцию между каждым термином в матрице документа термина. Количество терминов в матрице — 181841, а документов — 191431. Мне нужно получить коэффициент корреляции для каждого термина с другим термином.
Я...
255 просмотров
schedule
01.07.2022
R- Анализ текста- Печать определенного текста, содержащего биграмму
Анализ текста с Р.
Мой набор данных — 2000 комментариев из 2000 разных опросов. Я создал Биграммы. Я проверил частотность слов, затем кластерный анализ слов с hclust() , затем ассоциацию Word с findAssocs , например,...
47 просмотров
schedule
08.07.2022
Подсчет слов в тексте (в R): результаты нечитаемы
Я считаю слова в заданном тексте, используя R библиотеки tm и qdap . Когда в моем векторе ( words ) всего несколько слов, все выглядит нормально:
library(tm)
library(qdap)
text <- "activat affect affected affecting affects aggravat allow...
296 просмотров
schedule
05.10.2022
Объединить дубликаты и присвоить значение наибольшей частоты (кроме нейтральных!) в R
Я разместил очень похожий вопрос, но мне нужно изменить условия. у меня есть data.frame с несколькими записями. столбцы «нет», «статья» и «класс» («p» = положительный, «n» = отрицательный, «x» = нейтральный). это выглядит так:
no <- c(3, 3,...
51 просмотров
schedule
10.02.2023
R qdap::mgsub, как передать шаблон с помощью регулярного выражения?
В предыдущем вопросе ( заменить строка в R, дающая вектор шаблонов и вектор замен ) y обнаружил, что mgsub имеет в качестве шаблона строку, которую не нужно экранировать. Это хорошо, когда вы хотите заменить текст, например '[%.+%]', литеральной...
1241 просмотров
schedule
26.02.2023
подмножество/фильтр на основе таблицы частот
У меня есть df с некоторыми текстовыми данными, например.
words <- data.frame(terms = c("qhick brown fox",
"tom dick harry",
"cats dgs",
"qhick black...
183 просмотров
schedule
26.12.2022
Обновление словаря qdap для анализа настроений
Я использую функцию polarity из qdap . Есть несколько слов, которые я хочу добавить в словарь как отрицательные, когда они произносятся в сочетании. Например.
"Довольно плохо"
Оценка полярности становится нейтральной, когда она...
290 просмотров
schedule
04.01.2023
Применение пользовательского (взвешенного) словаря к тексту на основе анализа настроений
Я хочу настроить этот код, чтобы я мог назначить каждому из этих модальных глаголов различный вес. Идея состоит в том, чтобы использовать что-то похожее на библиотеку NRC, где у нас есть «числа» 1-5, представляющие категории, а не числа....
199 просмотров
schedule
18.12.2023