Слишком много текстовых аннотаций из-за видения Google

Я пытаюсь запросить TEXT_DETECTION и 1 из maxResults, это образец тела json:

{
  "requests": [
    {

      "image": {
          "content": "",
          "source": {
              "gcsImageUri": "",
              "imageUri": "https://www.optumhealthfinancial.com/content/dam/optumhealthfinancial/Images/receipts.gif"
            }
        },
      "features": [
        {
          "type": "TEXT_DETECTION",
          "maxResults": 1
        }
      ]
    }
  ]
}

Но результат textAnnotations имеет более одной записи и размер ответа более 1 МБ.

google-cloud-platform google-vision

itx 15.01.2018 источник

Ответы (2)

arrow_upward
1
arrow_downward

Из описания ответов при обнаружении текста:

Ответ TEXT_DETECTION включает обнаруженную фразу, ее ограничивающую рамку и отдельные слова и их ограничивающие рамки.

Таким образом, у вас будут ограничивающие рамки для каждого слова в вашем примере изображения. Кроме того, из определения TextAnnotation

TextAnnotation содержит структурированное представление текста, извлеченного с помощью OCR. Иерархия извлеченной текстовой структуры OCR выглядит следующим образом: TextAnnotation -> Page -> Block -> Paragraph -> Word ->

Размер ваших результатов зависит от количества информации, содержащейся в вашем примере изображения. maxResults предназначен для случаев, когда может быть несколько результатов (faceAnnotation, textAnnotations), как описано здесь. Вы не получаете несколько результатов, есть один результат для каждого слова обнаруженного абзаца.

Если вы хотите получить меньший результат, запустите запрос, используя DOCUMENT_TEXT_DETECTION:

{
  "requests": 
  [
    {
      "image": 
      {
        "content": "",
        "source": 
        {
          "gcsImageUri": "",
          "imageUri": "https://www.optumhealthfinancial.com/content/dam/optumhealthfinancial/Images/receipts.gif"
        }
      },
      "features": 
      [
        {
          "type": "DOCUMENT_TEXT_DETECTION",
          "maxResults": 1
        }
      ]
    }
  ]
}

Victor M Herasme Perez 15.01.2018

comment

Я имею в виду, какова функция maxResults, если я все еще получаю более одного результата textAnnotation? - itx; 16.01.2018

comment

maxResults предназначен для случаев, когда может быть более одного результата (faceAnnotation, textAnnotations). Посмотрите здесь. Вы не получаете несколько результатов, есть один результат для каждого слова обнаруженного абзаца. Если вы хотите получить меньший результат, запустите запрос, как показано ниже. - Victor M Herasme Perez; 16.01.2018

comment

Запустите это, используя DOCUMENT_TEXT_DETECTION:

{   "requests":    [     {       "image":        {         "content": "",         "source":          {           "gcsImageUri": "",           "imageUri": "https://www.optumhealthfinancial.com/content/dam/optumhealthfinancial/Images/receipts.gif"         }       },       "features":        [         {           "type": "DOCUMENT_TEXT_DETECTION",           "maxResults": 1         }       ]     }   ] }

- Victor M Herasme Perez; 16.01.2018

arrow_upward
0
arrow_downward

maxResults не относится к TEXT_DETECTION

Максимальное количество результатов этого типа. Не применяется к TEXT_DETECTION, DOCUMENT_TEXT_DETECTION или CROP_HINTS.

Brendan 11.06.2019

Слишком много текстовых аннотаций из-за видения Google

Ответы (2)

Вопросы по теме