Слишком много текстовых аннотаций из-за видения Google

Я пытаюсь запросить TEXT_DETECTION и 1 из maxResults, это образец тела json:

{
  "requests": [
    {

      "image": {
          "content": "",
          "source": {
              "gcsImageUri": "",
              "imageUri": "https://www.optumhealthfinancial.com/content/dam/optumhealthfinancial/Images/receipts.gif"
            }
        },
      "features": [
        {
          "type": "TEXT_DETECTION",
          "maxResults": 1
        }
      ]
    }
  ]
}

Но результат textAnnotations имеет более одной записи и размер ответа более 1 МБ.


person itx    schedule 15.01.2018    source источник


Ответы (2)


Из описания ответов при обнаружении текста:

Ответ TEXT_DETECTION включает обнаруженную фразу, ее ограничивающую рамку и отдельные слова и их ограничивающие рамки.

Таким образом, у вас будут ограничивающие рамки для каждого слова в вашем примере изображения. Кроме того, из определения TextAnnotation

TextAnnotation содержит структурированное представление текста, извлеченного с помощью OCR. Иерархия извлеченной текстовой структуры OCR выглядит следующим образом: TextAnnotation -> Page -> Block -> Paragraph -> Word ->

Размер ваших результатов зависит от количества информации, содержащейся в вашем примере изображения. maxResults предназначен для случаев, когда может быть несколько результатов (faceAnnotation, textAnnotations), как описано здесь. Вы не получаете несколько результатов, есть один результат для каждого слова обнаруженного абзаца.

Если вы хотите получить меньший результат, запустите запрос, используя DOCUMENT_TEXT_DETECTION:

{
  "requests": 
  [
    {
      "image": 
      {
        "content": "",
        "source": 
        {
          "gcsImageUri": "",
          "imageUri": "https://www.optumhealthfinancial.com/content/dam/optumhealthfinancial/Images/receipts.gif"
        }
      },
      "features": 
      [
        {
          "type": "DOCUMENT_TEXT_DETECTION",
          "maxResults": 1
        }
      ]
    }
  ]
}
person Victor M Herasme Perez    schedule 15.01.2018
comment
Я имею в виду, какова функция maxResults, если я все еще получаю более одного результата textAnnotation? - person itx; 16.01.2018
comment
maxResults предназначен для случаев, когда может быть более одного результата (faceAnnotation, textAnnotations). Посмотрите здесь. Вы не получаете несколько результатов, есть один результат для каждого слова обнаруженного абзаца. Если вы хотите получить меньший результат, запустите запрос, как показано ниже. - person Victor M Herasme Perez; 16.01.2018
comment
Запустите это, используя DOCUMENT_TEXT_DETECTION: { "requests": [ { "image": { "content": "", "source": { "gcsImageUri": "", "imageUri": "https://www.optumhealthfinancial.com/content/dam/optumhealthfinancial/Images/receipts.gif" } }, "features": [ { "type": "DOCUMENT_TEXT_DETECTION", "maxResults": 1 } ] } ] } - person Victor M Herasme Perez; 16.01.2018

maxResults не относится к TEXT_DETECTION

Максимальное количество результатов этого типа. Не применяется к TEXT_DETECTION, DOCUMENT_TEXT_DETECTION или CROP_HINTS.

person Brendan    schedule 11.06.2019