Величина тональности документа! = Сумма (величина предложения)

В настоящее время я использую API Google Cloud NL для некоторых тестов, в которых я анализирую новостные статьи. Сначала мне было любопытно, как рассчитывается размер документа, и поиски здесь дали

Google Cloud Natural Language API - как рассчитывается размер документа?

где было упомянуто, что это сумма величин составных предложений.

В моих собственных тестах я обнаружил, что это не так. Могу ли я что-то делать не так?


Для ясности я использую работающий Python 3.7.3 в среде conda с google-cloud-language, полученным от conda-forge.

document =types.Document(content = str, type = enums.Document.Type.PLAIN_TEXT)
sentiment = client.analyze_sentiment(document=document)

sentence_sents = sentiment.sentences
test_mag = 0
for sent_obj in sentence_sents:
     test_mag += sent_obj.sentiment.magnitude

print(sentiment.document_sentiment.magnitude)
print(test_mag)

person Alfred Ang    schedule 09.07.2019    source источник
comment
Не могли бы вы привести пример, когда это не работает?   -  person Mona Attariyan    schedule 10.07.2019


Ответы (1)


Из другого потока это может быть просто абсолютная сумма, но не всегда.

Совокупные результаты анализа тональности Google Natural Language

"Агрегирование работает так: входной текст разбивается на более мелкие компоненты, часто нграммы, что, вероятно, является причиной того, что в документации говорится об агрегировании, однако агрегирование - это не простое добавление, невозможно суммировать индивидуальные значения тональности каждого из них. сущность, чтобы получить общий балл ".

Я предполагаю, что это относится к подсчетам баллов и величин.

person biophetik    schedule 08.10.2019
comment
Глядя на этот патент, это может быть связано с чем-то связанным. Сочетание обработки сигнала и фильтрации / повышения абсолютных оценок для достижения их значения. Подход обработки сигналов к анализу тональности сущностей в документах - person biophetik; 09.10.2019
comment
Спасибо за ответ! Мне не пришло в голову проверить патент - person Alfred Ang; 17.12.2019