Я пытаюсь создать облако слов из набора данных
import numpy as np
import pandas as pd
from os import path
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import matplotlib.pyplot as plt
% matplotlib inline
Потом прочитал объединенный файл
df1 = pd.read_csv("Aug.csv")
df2 = pd.read_csv("Jul.csv")
df3 = pd.read_csv("Jun.csv")
df4 = pd.read_csv("Sep.csv")
df = pd.concat([df1, df2, df3, df4])
Извлечь ТОЛЬКО столбец сводки
dfs = df['summary']
Создать облако слов
wordcloud = WordCloud().generate(dfs)
Вышла ошибка
TypeError: ожидаемая строка или байтовый объект
Я искал решение, но ни один из ответов или ресурсов не решил мою проблему ...
Могу я спросить, почему это происходит, и, возможно, найти решение? Большое спасибо!!!
Я использую Jupyter Notebook
Мой тип данных выглядит так
id listing_url name summary
123 https:1 hello python Apple Find this please. Hello bbb / 1IDK hello......end.
456 https:2 world Boo hello
789 https:3 python...world My xxx 1 okay please. Just a 10-minute.......end.
Aug.csv
в качестве примера, пожалуйста? - person SSharma   schedule 06.12.2019wordcloud = WordCloud().generate(" ".join(dfs))
, потому что wordcloud нуждается в строке в качестве параметра. Использование пробела для предотвращения объединения последнего слова одной записи с первым словом следующей. - person JohanC   schedule 09.12.2019