Что может происходить
Я собираюсь предположить, что вы используете Default Configuration
, предоставленный Watson Discovery. Default Configuration
применяет обогащение к одному полю во входных данных, полю с именем text
. Конвертеры для HTML, PDF и Microsoft Word по умолчанию выводят текст документа в поле JSON text
. Когда вы отправляете JSON в Watson Discovery, преобразование не выполняется - имена полей проходят напрямую.
То, что вы можете попробовать
- Настройте входной JSON так, чтобы поле верхнего уровня с именем
text
содержало текст, который вы хотите обогатить.
- Создайте и используйте пользовательскую конфигурацию, в которой одна или несколько записей в
enrichments
, которые имеют значение source_field
, будут именем поля в вашем JSON, которое вы хотите, чтобы Watson Discovery обогатил.
Watson Discovery Tooling может быть очень полезным для экспериментов с пользовательскими конфигурациями.
Пример
Чтобы получить конкретную информацию об этом. Вот часть enrichments
Default Configuration
:
"enrichments": [{
"destination_field": "enriched_text",
"source_field": "text",
"enrichment": "alchemy_language",
"options": {
"extract": "keyword, entity, doc-sentiment, taxonomy, concept, relation",
"sentiment": true,
"quotations": true
}
}]
Если ваш JSON содержит текст на английском языке в поле с именем paragraphs
, и вы хотите, чтобы Watson Discovery предоставил расширенные возможности для этого поля, вы можете использовать эту конфигурацию:
"enrichments": [{
"destination_field": "enriched_paragraphs",
"source_field": "paragraphs",
"enrichment": "alchemy_language",
"options": {
"extract": "keyword, entity, doc-sentiment, taxonomy, concept, relation",
"sentiment": true,
"quotations": true
}
}]
person
Bruce Adams
schedule
23.05.2017