Правильный способ загрузки PDF в Google Cloud Automl

Я хотел бы знать, есть ли четкое руководство, показывающее шаги для загрузки PDF-файла в GCP-AutoML NLP?

1.) Я попытался загрузить PDF-файл в ведро, например. ABC.pdf

2.) Настройте training.JSONL, заменив расположение файла на ABC.pdf.

{
  "document": {
    "input_config": {
      "gcs_source": {
        "input_uris": [ "gs://automl/ABC.pdf" ]
      }
    }
  }
}

3.) Открываю новый csv, вставляю ссылку gs в файл

gs://automl/training.jsonl

4.) Когда я создаю набор данных для AutoML. Он показывает следующее

Error: Has critical error in root level csv gs://automl/order.csv line 1: Expected 2 columns, but found 1 columns only.

Он не показывает, какие столбцы требуются в руководстве. Спасибо вам за вашу помощь


person Platalea Minor    schedule 13.09.2019    source источник


Ответы (1)


В файле csv каждая строка должна иметь набор содержимого, например:

TRAIN,gs://automl/training.jsonl

в противном случае он должен начинаться с запятой, чтобы указать, что первый столбец пуст, например:

,gs://automl/training.jsonl
person jgutix    schedule 11.04.2020