Google Cloud AutoML Object Detection экспорт позиций объектов CSV

Я помечаю объекты на изображениях с помощью инструмента меток Google Cloud AutoML. Затем я экспортировал файл csv. Вот результат:

TRAIN,gs://optik-vcm/optikic/80-2020-03-19T11:58:25.819Z.jpg,kenarcizgi,0.92590326,0.035908595,0.9589712,0.035908595,0.9589712,0.9020675,0.92590326,0.9020675

По красоте это так:

TRAIN
gs://optik-vcm/optikic/80-2020-03-19T11:58:25.819Z.jpg
kenarcizgi
0.92590326
0.035908595
0.9589712
0.035908595
0.9589712
0.9020675
0.92590326
0.9020675

Я знаю первые три колонки.

Я увеличу количество изображений, сделав приумножение данных. Для этого я буду использовать OpenCV в Python. Но мне нужны координаты объектов на изображении.

Как я могу преобразовать эти десятичные дроби в координаты пикселей? Или на это есть какой-то расчет?


person sundowatch    schedule 20.03.2020    source источник


Ответы (1)


Они называются NormalizedVertex.

Вершина представляет собой двухмерную точку изображения. Нормализованные координаты вершины находятся в диапазоне от 0 до 1 доли относительно исходной плоскости (изображение, видео). Например. если плоскость (например, все изображение) будет иметь размер 10 x 20, то точка с нормализованными координатами (0,1, 0,3) будет в позиции (1, 6) на этой плоскости.

Чтобы получить координату в пикселях, вы можете умножить это число на ширину или длину ввода, если это необходимо.


Вся ссылка на форматирование CSV объясняется полностью следующие (усеченные) составляют каждую строку (одна строка на ограничивающую рамку или на изображение):

  • TRAIN - Который набор для присвоения содержимого в этой строке
  • gs://optik-vcm/... - URI Google Cloud Storage
  • kenarcizgi - метка, определяющая, как объект классифицируется
  • A bounding box for an object in the image:
    • x_relative_min, y_relative_min, x_relative_max, y_relative_min, x_relative_max, y_relative_max, x_relative_min, y_relative_max
person MyNameIsCaleb    schedule 23.03.2020