Автонастройка параметров облака слов в python

Я хочу создать облака слов из разных частей речи текста. Проблема, с которой я сталкиваюсь, заключается в том, что я не хочу сам настраивать параметры для каждого из них. Более того, поскольку я использую это для нескольких документов, очень утомительно делать это для каждого. Есть ли автоматизированный подход?

    max_w=max(len(verbs),len(adjectives),len(adverbs),len(nouns))
    word_cloud_generator("verbs",verbs,description,len(verbs)/max_w)
    word_cloud_generator("adjectives",adjectives,description,len(adjectives)/max_w)
    word_cloud_generator("adverbs",adverbs,description,len(adverbs)/max_w)
    word_cloud_generator("nouns",nouns,description,len(nouns)/max_w)

    def word_cloud_generator(part,data,description,scale):
        TEXT= " ".join(data)
        xlim=600*(scale)
        ylim=600*(scale)
        max_size= 200*(scale)
        min_size=2*(scale)
        threshold=4*(scale)
        tags = make_tags(get_tag_counts(TEXT), maxsize=max_size,minsize=min_size)
        tags=[a for a in tags if a['size'] > threshold]
        filename=description+ "_"+part+'.png'
        create_tag_image(tags,filename , size=(xlim, ylim), fontname='Molengo', \
            background=(0,0,0),rectangular=True)

Пожалуйста помоги.

Редактировать: приведенный выше код пытается выбрать параметры облака слов в зависимости от количества слов в тексте. Но результаты, которые я получаю, недостаточно эффективны. Под эффективностью я подразумеваю лаконичное и неперекрывающееся облако слов с разумным размером изображения.

Abhishek Bhatia 07.08.2015 источник

comment

Пожалуйста, уточните, что делает ваш код и в чем вам нужна помощь. Есть ли автоматизированный подход к что? То, что у вас есть, уже выглядит автоматизированным - Stiffo 07.08.2015

comment

@Stiffo Спасибо за ответ! Извините, что не объяснил раньше. Пожалуйста, проверьте сейчас. - Abhishek Bhatia 07.08.2015

comment

Не знаю, как помочь вам в разумные сроки, вы можете попробовать проверить аналогичный проект Python: github.com/amueller/word_cloud - Stiffo 07.08.2015

comment

stackoverflow .com/questions/29264410/ и stackoverflow.com/questions/16645799/ - alvas 07.08.2015

comment

@Стиффо Спасибо! Кажется, это работает лучше. Только один вопрос при использовании wordcloud = WordCloud(width=1600, height=800).generate(TEXT) удаляет ли он общие слова или мне следует использовать process_text amueller.github.io/word_cloud/generated/ - Abhishek Bhatia 07.08.2015

comment

Извините, но без понятия. Я никогда не использовал его. Вам нужно будет попробовать свой путь или попытаться прочитать любую документацию на странице - Stiffo 10.08.2015

Автонастройка параметров облака слов в python

Вопросы по теме