Обнаружение объектов — это метод компьютерного зрения, который обнаруживает присутствие определенного класса объектов на изображении или видео. Обнаружение объектов сочетает в себе задачи локализации объектов и классификации объектов. Локализация — это процесс рисования ограничивающих рамок вокруг объекта, а классификация — это процесс присвоения объекту метки класса. Еще одна задача компьютерного зрения, называемая сегментацией объектов, где экземпляры распознанных пикселей объекта подсвечиваются вместо рисования ограничивающих рамок.

Ниже приведены некоторые ключевые алгоритмы, используемые для обнаружения объектов:

  1. R-CNN
  2. Быстрый R-CNN
  3. Быстрее R-CNN
  4. Фреймворк Yolo (Yolo, YoloV2, YoloV3)
  5. SSD
  6. RetinaNet

Мы заинтересованы в аннотировании данных для использования в формате YoloV3 и рассмотрим, как использовать облачные аннотации для подготовки наших данных.

Облачные аннотации позволяют нам рисовать ограничивающие рамки вокруг интересующего нас объекта на наших изображениях и аннотировать его. Прежде чем приступить к работе с инструментом, рекомендуется создать экземпляр облачного хранилища объектов в облаке IBM, чтобы надежно хранить данные обучения и, при необходимости, обеспечить совместную работу в команде.
Не беспокойтесь, в IBM Cloud есть бесплатный уровень хранения объектов объемом 25 ГБ, поэтому он поможет вам начать работу без каких-либо затрат. Начните с регистрации или входа в IBM cloud. После входа в панель управления нажмите Создать ресурс, чтобы начать.

Выберите услугу объектного хранилища

Выберите тарифный план, нажмите «Создать» и подтвердите. Когда у нас есть экземпляр объекта для доступа к данным из внешнего источника, нам нужны учетные данные службы. Для этого перейдите к учетным данным службы и нажмите «Новые учетные данные».

При добавлении новых учетных данных убедитесь, что для роли установлено значение «Писатель», а для встроенных параметров конфигурации HMAC установлено значение true.

После добавления нажмите «Просмотреть учетные данные» и запишите apikey, access_key_id, secret_access_key и resource_instance_id.

Теперь перейдите к облачным аннотациям и войдите в систему или нажмите Продолжить с IBM cloud.

После входа в систему нажмите «Начать новый проект», чтобы начать аннотирование ваших данных. Введите имя корзины, мы будем хранить наши файлы в корзинах.

Выберите тип аннотации как локализацию

Нажмите Файл->Загрузить медиафайл, чтобы загрузить изображения/видео. Добавьте необходимые метки и начните рисовать ограничивающие рамки на объектах, которые вы хотите обнаружить.

После того, как вы закончите аннотировать изображения, нажмите Файл->Экспортировать как YOLO, чтобы экспортировать аннотации в требуемом формате. Вы можете использовать эти данные, чтобы начать обучение вашего детектора объектов с помощью Yolo.
Этот инструмент также может экспортироваться в форматы CreateML, Pascal VOC или в виде zip-папки.

Существуют аналогичные инструменты Labelbox, LabelMe и RectLabel, которые вы можете изучить.

Это краткое изложение того, как вы можете аннотировать данные и экспортировать их в формат Yolo, чтобы начать работать над обнаружением объектов.