Вопросы по теме 'qdap'

транспонировать строку в столбец в R с помощью qdap
Я использовал функцию wfm в пакете "qdap" для транспонирования значений текстовой строки в столбцы и столкнулся с проблемой, когда данные содержат числа вместе с текстом. Например, если значение строки равно «abcdef», транспонирование работает...
175 просмотров
schedule 18.11.2021

Извлечение и подсчет общих пар слов из вектора символов
Как можно найти частые пары соседних слов в векторе символов? Например, при использовании набора данных по сырой нефти наиболее распространенными парами являются «сырая нефть», «рынок нефти» и «миллион баррелей». Код для небольшого примера ниже...
3041 просмотров
schedule 11.09.2021

Поиск ассоциации между всеми терминами в матрице документа терминов — огромный размер
У меня есть требование найти корреляцию между каждым термином в матрице документа термина. Количество терминов в матрице — 181841, а документов — 191431. Мне нужно получить коэффициент корреляции для каждого термина с другим термином. Я...
255 просмотров
schedule 01.07.2022

R- Анализ текста- Печать определенного текста, содержащего биграмму
Анализ текста с Р. Мой набор данных — 2000 комментариев из 2000 разных опросов. Я создал Биграммы. Я проверил частотность слов, затем кластерный анализ слов с hclust() , затем ассоциацию Word с findAssocs , например,...
47 просмотров

Подсчет слов в тексте (в R): результаты нечитаемы
Я считаю слова в заданном тексте, используя R библиотеки tm и qdap . Когда в моем векторе ( words ) всего несколько слов, все выглядит нормально: library(tm) library(qdap) text <- "activat affect affected affecting affects aggravat allow...
296 просмотров
schedule 05.10.2022

Объединить дубликаты и присвоить значение наибольшей частоты (кроме нейтральных!) в R
Я разместил очень похожий вопрос, но мне нужно изменить условия. у меня есть data.frame с несколькими записями. столбцы «нет», «статья» и «класс» («p» = положительный, «n» = отрицательный, «x» = нейтральный). это выглядит так: no <- c(3, 3,...
51 просмотров
schedule 10.02.2023

R qdap::mgsub, как передать шаблон с помощью регулярного выражения?
В предыдущем вопросе ( заменить строка в R, дающая вектор шаблонов и вектор замен ) y обнаружил, что mgsub имеет в качестве шаблона строку, которую не нужно экранировать. Это хорошо, когда вы хотите заменить текст, например '[%.+%]', литеральной...
1241 просмотров
schedule 26.02.2023

подмножество/фильтр на основе таблицы частот
У меня есть df с некоторыми текстовыми данными, например. words <- data.frame(terms = c("qhick brown fox", "tom dick harry", "cats dgs", "qhick black...
183 просмотров
schedule 26.12.2022

Обновление словаря qdap для анализа настроений
Я использую функцию polarity из qdap . Есть несколько слов, которые я хочу добавить в словарь как отрицательные, когда они произносятся в сочетании. Например. "Довольно плохо" Оценка полярности становится нейтральной, когда она...
290 просмотров
schedule 04.01.2023

Применение пользовательского (взвешенного) словаря к тексту на основе анализа настроений
Я хочу настроить этот код, чтобы я мог назначить каждому из этих модальных глаголов различный вес. Идея состоит в том, чтобы использовать что-то похожее на библиотеку NRC, где у нас есть «числа» 1-5, представляющие категории, а не числа....
199 просмотров
schedule 18.12.2023