Невозможно прочитать одни и те же данные таблицы из PDF-файла, охватывающего несколько страниц, с использованием клиентской библиотеки распознавателя форм с использованием кода C #

Я не могу прочитать данные таблицы, которые находятся на следующей странице. Я использую код C # для извлечения данных с помощью FormRecognizerClient и с помощью обученной пользовательской модели в консольном приложении. Также попытался использовать StartRecognizeInvoicesFromUriAsync, то есть с помощью анализа счетов-фактур FormRecognizerClient, это также не удалось в этом сценарии, упомянутом выше.

И FormRecognizerClient в C # также не распознает заголовки в таблице. Я использую ссылку ниже для кода библиотеки FormRecognizerClient C #, https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/client-library?tabs=preview%2Cv2-1&pivots=programming-language-csharp#analysis-invoices.

Ищу любую помощь.

Ниже приведена ссылка на изображение, показывающая формат для pdf: https://i.stack.imgur.com/mx5NW.png


person Sandeep Guduru    schedule 01.03.2021    source источник


Ответы (1)


Form Recognizer еще не поддерживает таблицы, охватывающие страницы, и будет извлекать каждую таблицу на страницу. Не могли бы вы поделиться фрагментом таблицы на второй странице, которая не обнаружена (пожалуйста, анонимизируйте все данные и отредактируйте все данные перед тем, как поделиться)

person Neta    schedule 01.03.2021
comment
фрагмент добавлен в тот же пост - person Sandeep Guduru; 02.03.2021
comment
Они должны быть извлечены как позиции на всех страницах в предстоящем выпуске (15 марта), попробуйте это в публикации модели счета-фактуры 15 марта здесь - fott-preview.azurewebsites.net - person Neta; 03.03.2021