Статьи по теме qdap

Вопросы по теме 'qdap'

транспонировать строку в столбец в R с помощью qdap

Я использовал функцию wfm в пакете "qdap" для транспонирования значений текстовой строки в столбцы и столкнулся с проблемой, когда данные содержат числа вместе с текстом. Например, если значение строки равно «abcdef», транспонирование работает...

175 просмотров

r transpose qdap

18.11.2021

Извлечение и подсчет общих пар слов из вектора символов

Как можно найти частые пары соседних слов в векторе символов? Например, при использовании набора данных по сырой нефти наиболее распространенными парами являются «сырая нефть», «рынок нефти» и «миллион баррелей». Код для небольшого примера ниже...

3041 просмотров

r regex-lookarounds tm qdap

11.09.2021

Поиск ассоциации между всеми терминами в матрице документа терминов — огромный размер

У меня есть требование найти корреляцию между каждым термином в матрице документа термина. Количество терминов в матрице — 181841, а документов — 191431. Мне нужно получить коэффициент корреляции для каждого термина с другим термином. Я...

255 просмотров

r qdap

01.07.2022

R- Анализ текста- Печать определенного текста, содержащего биграмму

Анализ текста с Р. Мой набор данных — 2000 комментариев из 2000 разных опросов. Я создал Биграммы. Я проверил частотность слов, затем кластерный анализ слов с hclust() , затем ассоциацию Word с findAssocs , например,...

47 просмотров

r hierarchical-clustering tm text-analysis qdap

08.07.2022

Подсчет слов в тексте (в R): результаты нечитаемы

Я считаю слова в заданном тексте, используя R библиотеки tm и qdap . Когда в моем векторе ( words ) всего несколько слов, все выглядит нормально: library(tm) library(qdap) text <- "activat affect affected affecting affects aggravat allow...

296 просмотров

r dataframe text-mining word-frequency qdap

05.10.2022

Объединить дубликаты и присвоить значение наибольшей частоты (кроме нейтральных!) в R

Я разместил очень похожий вопрос, но мне нужно изменить условия. у меня есть data.frame с несколькими записями. столбцы «нет», «статья» и «класс» («p» = положительный, «n» = отрицательный, «x» = нейтральный). это выглядит так: no <- c(3, 3,...

51 просмотров

r merge duplicates tm qdap

10.02.2023

R qdap::mgsub, как передать шаблон с помощью регулярного выражения?

В предыдущем вопросе ( заменить строка в R, дающая вектор шаблонов и вектор замен ) y обнаружил, что mgsub имеет в качестве шаблона строку, которую не нужно экранировать. Это хорошо, когда вы хотите заменить текст, например '[%.+%]', литеральной...

1241 просмотров

r qdap

26.02.2023

подмножество/фильтр на основе таблицы частот

У меня есть df с некоторыми текстовыми данными, например. words <- data.frame(terms = c("qhick brown fox", "tom dick harry", "cats dgs", "qhick black...

183 просмотров

r qdap

26.12.2022

Обновление словаря qdap для анализа настроений

Я использую функцию polarity из qdap . Есть несколько слов, которые я хочу добавить в словарь как отрицательные, когда они произносятся в сочетании. Например. "Довольно плохо" Оценка полярности становится нейтральной, когда она...

290 просмотров

r nlp qdap

04.01.2023

Применение пользовательского (взвешенного) словаря к тексту на основе анализа настроений

Я хочу настроить этот код, чтобы я мог назначить каждому из этих модальных глаголов различный вес. Идея состоит в том, чтобы использовать что-то похожее на библиотеку NRC, где у нас есть «числа» 1-5, представляющие категории, а не числа....

199 просмотров

inner-join text-mining quanteda tm qdap

18.12.2023