Я хочу создать облако слов с набором данных на Kaggle. Однако у меня возникают проблемы с WordCloud, из-за чего возникает ошибка Недостаточно памяти для вычисления облака слов.
Код, который у меня есть:
# Loading The Data
filename = "../input/us-accidents/US_Accidents_June20.csv"
df = pd.read_csv(filename)
# Import package and it's set of stopwords
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
# Create stopword list
stopwords = set(STOPWORDS)
stopwords.update(["due",'accident'])
# Combine all description into one big text
df['Description']=str(df['Description'])
text = ' '.join(df['Description'])
# Create and generate a word cloud image:
wordcloud = WordCloud(
background_color='white',
max_font_size=50,
max_words=50,
stopwords=stopwords
).generate(text)
# Display the generated image:
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
Это потому, что «текст» слишком велик, чтобы его можно было обработать? Есть ли другой способ объединить описание в один большой текст, чтобы word_cloud смог его обработать?