Публикации по теме 'word-cloud'


Классификация текста: подходы к обучению с учителем и без учителя
Исследование классификации текста с использованием текстовых функций и моделирования тем, от концепции до развертывания. Полтора года назад я случайно наткнулся на Python и Anaconda в качестве инструмента для Data Science (DS) во время участия в Data Hackathon. Множество библиотек Python подчеркивают универсальность Python как инструментария для науки о данных. К сожалению, тогда у меня не было необходимого набора навыков для использования Python. С тех пор я прошел онлайн-курсы по..

Визуализируйте президентские дебаты 2020 года в облаке Word
Президентские дебаты в США в 2020 году между Джо Байденом и Дональдом Трампом, проходившие в Нэшвилле, с изменениями в их формате, например, в течение первых двух минут каждого сегмента кандидату, чья очередь не говорить, будет отключен микрофон, и гости должны быть в масках. Ага!! мы в 2020!! Дебаты состоят из шести 15-минутных сегментов, посвященных борьбе с covid-19, американским семьям, расе в Америке, изменению климата, национальной безопасности и лидерству. Я предполагаю, что..

Анализ твитов Дональда Трампа на разных этапах его жизни с помощью НЛП
С момента президентства Трампа роль твиттера изменилась: он стал официальным источником информации, например, через твит получать новости об увольнении Трампа госсекретаря. Дональд Трамп, в отличие от любого другого президента, просыпается в твиттере в начале президентства Трампа. Дональд Трамп твитнул со скоростью 9 твитов в день, но со временем количество твитов утроилось. По данным New York Times, Дональд Трамп написал в Твиттере 11000 раз за 33 месяца. Твиттер всегда был любимой..

Один XGBoost, чтобы управлять ими всеми!
В этом проекте я исследовал три регрессионных алгоритма машинного обучения для расчета цены подержанных автомобилей. Я изучил различные ключевые факторы, влияющие на цену подержанных автомобилей, и немного классной визуализации данных. После импорта наборов данных и работы с несколькими отсутствующими значениями я погрузился в часть визуализации данных. Используя seaborn и wordcloud, я смог создать следующие диаграммы: Моя главная цель в этом проекте состояла в том, чтобы..

Тематическое моделирование / Облачный процесс Word из комментариев на YouTube !?
Фахрул Энди Сетьяван и Дви Октавиана Путери Versi Indonesia =› начать Облако слов (также известное как текстовое облако или облако тегов) — это метод визуального отображения текстовых данных. Этот график популярен при анализе текста, потому что его легко понять. Используя облако слов, можно отобразить обзор частотности слов в привлекательной, но информативной форме. Чем чаще используется слово, тем больше размер слова будет отображаться в облаке слов. На этот раз мы..

Вопросы по теме 'word-cloud'

Перекрытие в d3 wordcloud
Я использую библиотеку wordcloud Джейсона Дэвиса для d3 ( https://github.com/jasondavies/d3-cloud ) и моя проблема в том, что слова в облаке перекрываются. Я знаю, что уже есть вопросы по этой проблеме с переполнением стека (и на других сайтах), но...
7190 просмотров
schedule 15.09.2021

Создание облака слов, но с комбинированными словами?
Я пытаюсь составить облако слов из ключевых слов публикаций. например: интеллектуальный анализ образовательных данных; совместное обучение; информатика ... и т. д. Мой текущий код выглядит следующим образом: KeywordsCorpus <-...
6064 просмотров
schedule 21.10.2021

Ошибка интеллектуального анализа текста. Получение этой ошибки при создании DocumentTermMatrix и Word Cloud.
Я получаю сообщение об ошибке ' Ошибка в simple_triplet_matrix (i, j, v, nrow = length (terms), ncol = length (corpus),:' i, j 'invalid' При создании DocumentTermMatrix или создании облака слов. Это происходит во всех наборах данных. Вот код,...
233 просмотров
schedule 15.09.2021

tidytext как сделать облака слов общности и сравнения
Позвольте мне начать со следующего и полностью рабочего кода из Введение в tidytext @ CRAN library(janeaustenr) library(dplyr) library(stringr) original_books <- austen_books() %>% group_by(book) %>% mutate(linenumber =...
637 просмотров
schedule 16.11.2021

Отфильтрованные данные внутри sliderInput () блестят?
У меня есть sliderInput (), максимальное значение которого я хотел бы изменить в зависимости от ввода пользователя. Я пытаюсь создать wordcloud, и код для wordcloud работает, только мой слайдер нуждается в корректировке. Итак, мой набор данных...
1032 просмотров
schedule 17.11.2021

Создайте Wordcloud из набора данных, используя только один столбец
Я пытаюсь создать облако слов из набора данных import numpy as np import pandas as pd from os import path from PIL import Image from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator import matplotlib.pyplot as plt % matplotlib inline...
302 просмотров

Облако слов делает ошибку в Python: строковые индексы должны быть целыми числами
Я пытаюсь сделать облако слов из текстового файла с помощью этого кода: import numpy as np import matplotlib.pyplot as plt from PIL import Image from wordcloud import WordCloud, STOPWORDS from IPython.display import Image as im file =...
172 просмотров
schedule 15.10.2021

Я не могу создать облако с помощью этого алгоритма
Я пытаюсь запустить этот код, чтобы создать облако слов, которое я видел в классе. Но я не могу найти решение проблемы по ошибке, которая появляется там, где я пытаюсь построить wordcloud. ошибка: Ошибка в wordcloud (dfCorpus, max.words = 100,...
27 просмотров
schedule 17.10.2021

D3: Использование принудительного макета для облаков слов
Я работаю над визуализацией тегов, где теги переходят между различными макетами, управляемыми принудительно. У меня было несколько проблем с выяснением того, как перейти от пузырьковой диаграммы к диаграмме узлов, но я немного застрял в том, как...
1796 просмотров

Рефакторинг алгоритма облака слов
В рамках алгоритма рендеринга облака слов (вдохновленного этим вопросом ) я создал функцию Javascript / Processing.js, которая перемещает прямоугольник слова по постоянно увеличивающейся спирали, пока больше не будет столкновения с ранее помещенными...
917 просмотров

Ошибки при создании wordcloud с помощью пакетов tm и wordcloud в R
Мне немного неясны некоторые ошибки, возникающие при использовании пакета tm . Я знаю, что функция wordcloud в пакете wordcloud принимает в качестве аргумента корпус: Как указано в документации: (слова, которые вы даете функции) могут быть...
1073 просмотров
schedule 01.04.2022

Изменить цвет шрифта сгенерированного облака слов
В настоящее время я использую эту библиотеку для создания облака слов. В настоящее время сгенерированное изображение выглядит так: Однако я смогу распечатать это только на черно-белом принтере, поэтому цвет шрифта будет неглубоким, и я хочу...
4339 просмотров
schedule 06.05.2022

Wordcloud в R без тм
Я пытался использовать Wordcloud без пакета «tm», так как он поддерживается в версиях 3.1 и выше, но в большинстве Linux-систем по умолчанию установлен R 3.0.8 (из репозитория apt). Поэтому я подумал преобразовать файл слов в data.frame в объект...
313 просмотров
schedule 29.07.2022

Как создать диаграмму wordcloud для каждого идентификатора пользователя на основе частоты и значения в python
Я пытаюсь создать каждый граф облака слов для каждого пользователя на основе частоты слова и подсчета, и я хочу сохранить вывод пути изображения облака слов в кадре данных вместе с UID. Нужно ли мне применять группу? Любая помощь будет высоко...
123 просмотров
schedule 03.10.2022

Отзывчивая ширина с wordcloud2.js (элемент холста html5)
С помощью wordcloud2.js вы можете создавать красивые и простые облака слов на элементы холста . У меня действительно нет проблем с этим скриптом, на самом деле только с элементом холста в целом: я хотел бы иметь отзывчивую ширину (в данном...
3932 просмотров

Автонастройка параметров облака слов в python
Я хочу создать облака слов из разных частей речи текста. Проблема, с которой я сталкиваюсь, заключается в том, что я не хочу сам настраивать параметры для каждого из них. Более того, поскольку я использую это для нескольких документов, очень...
443 просмотров
schedule 19.07.2023

Облако слов в R с двумя отдельными значениями
Как новичок в R, я работаю над созданием облака слов, которое показывает две переменные: frequency и rating . Используя общую таблицу, я хочу отобразить гипотетическое количество колледжей (шрифт = от большого к меньшему по количеству) по штатам и...
1927 просмотров
schedule 26.11.2022

Массив кортежей, необходимых для метода generate_from_frequencies в Python wordcloud
Я пытаюсь создать облако слов в Python на основе значения строк и соответствующих им значений данных в документе Excel. Метод generate_from_frequencies принимает параметр частот, который, как говорят в документации, должен принимать массив кортежей....
2033 просмотров
schedule 12.05.2023

Удаление символов / знаков из строки
Я готовлю текст для облака слов, но застреваю. Мне нужно убрать все цифры, все знаки вроде. , -? знак равно @ и т. д., но я не знаю как. Я не хочу заменять снова и снова. Есть ли способ для этого? Вот моя концепция и то, что мне нужно...
214 просмотров
schedule 14.05.2023

wordcloud для файла csv в python
у меня есть файл csv с 2 столбцами (dataframe) столбец 1 содержит предложение я люблю банан а столбец 2 содержит класс, который у меня есть 5 classes Мне нужно облако слов для каждого класса, на самом деле все семенции, соответствующие каждому...
1658 просмотров
schedule 22.03.2023