Приложение Watson Discovery не работает с JSON

Привет, я пытаюсь загрузить файл json в качестве набора данных в консоль обнаружения Watson. Обычно для PDF-файлов и других принятых форматов файлов обогащение данных (ключевые слова, сущность, таксономия и т. Д.) АВТОМАТИЧЕСКИ создается приложением Discovery. Однако, если я загружу набор данных в JSON, он не сделает то же самое.

Есть ли какой-то конкретный формат JSON, которому необходимо следовать? И я прав, что он сам автоматически вставляет обогащения?


person aniket    schedule 23.05.2017    source источник


Ответы (2)


Что может происходить

Я собираюсь предположить, что вы используете Default Configuration, предоставленный Watson Discovery. Default Configuration применяет обогащение к одному полю во входных данных, полю с именем text. Конвертеры для HTML, PDF и Microsoft Word по умолчанию выводят текст документа в поле JSON text. Когда вы отправляете JSON в Watson Discovery, преобразование не выполняется - имена полей проходят напрямую.

То, что вы можете попробовать

  1. Настройте входной JSON так, чтобы поле верхнего уровня с именем text содержало текст, который вы хотите обогатить.
  2. Создайте и используйте пользовательскую конфигурацию, в которой одна или несколько записей в enrichments, которые имеют значение source_field, будут именем поля в вашем JSON, которое вы хотите, чтобы Watson Discovery обогатил.

Watson Discovery Tooling может быть очень полезным для экспериментов с пользовательскими конфигурациями.

Пример

Чтобы получить конкретную информацию об этом. Вот часть enrichments Default Configuration:

"enrichments": [{
  "destination_field": "enriched_text",
  "source_field": "text",
  "enrichment": "alchemy_language",
  "options": {
    "extract": "keyword, entity, doc-sentiment, taxonomy, concept, relation",
    "sentiment": true,
    "quotations": true
  }
}]

Если ваш JSON содержит текст на английском языке в поле с именем paragraphs, и вы хотите, чтобы Watson Discovery предоставил расширенные возможности для этого поля, вы можете использовать эту конфигурацию:

"enrichments": [{
  "destination_field": "enriched_paragraphs",
  "source_field": "paragraphs",
  "enrichment": "alchemy_language",
  "options": {
    "extract": "keyword, entity, doc-sentiment, taxonomy, concept, relation",
    "sentiment": true,
    "quotations": true
  }
}]
person Bruce Adams    schedule 23.05.2017

Вы можете загружать внутри интерфейса и с cURL.

См. Один пример (cURL) - Создайте коллекцию:

curl -X POST -u "{username}":"{password}" -H "Content-Type: application/json" -d '{
  "name": "test_collection",
  "description": "My test collection",
  "configuration_id": "{configuration_id}"
}' "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_id}/collections?version=2016-12-01"

Вы установите "Content-Type: application/json". Вставьте свои username и password с Service Credentials. И установите свой enviromenment_id внутри URL-адреса.

Добавьте документ:

curl -X POST -u "{username}":"{password}" -F [email protected] "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_id}/collections/{collection_id}/documents?version=2016-12-01"

Обс .: Документ для приема. Максимальный поддерживаемый размер файла - 50 мегабайт. Файлы размером более 50 мегабайт отклоняются. API определяет тип документа, но вы можете указать его, если он неверен. Допустимые значения типа MIME: application/json, application / msword, application / vnd.openxmlformats-officedocument.wordprocessingml.document, application / pdf, text / html и application / xhtml + xml. Укажите тип содержимого в составной форме как type=.

curl -X PUT -u "{username}":"{password}" -H "Content-Type: application/json" -d@my_config.json "https://gateway.watsonplatform.net/discovery/api/v1/environments/{environment_ID}/configurations/{Configuration_ID}?version=2016-12-01"

См. официальную справочную документацию по API.

person Sayuri Mizuguchi    schedule 23.05.2017