предварительная обработка изображений для классификации изображений и семантической сегментации

Что касается обучения моделей глубокого обучения для различных типов работ, связанных с изображениями, таких как классификация изображений, семантическая сегментация, какие работы по предварительной обработке необходимо выполнить?

Например, если я хочу обучить сеть семантической сегментации, нужно ли мне масштабировать значение изображения (обычно представленное как nd-массив) до диапазона [0,1] или сохранять его как диапазон [0,255]? Спасибо.


person user288609    schedule 28.11.2016    source источник
comment
Обычно люди масштабируют изображение.   -  person malreddysid    schedule 29.11.2016
comment
Спасибо за комментарии. Вы имеете в виду масштабирование изображения до предопределенного диапазона, например [0,1]? Хотели бы вы подробнее рассказать?   -  person user288609    schedule 29.11.2016
comment
да. Масштабируйте его до [0,1].   -  person malreddysid    schedule 29.11.2016
comment
И вычтите среднее изображение.   -  person malreddysid    schedule 29.11.2016
comment
Большое спасибо за ваше разъяснение.   -  person user288609    schedule 29.11.2016


Ответы (1)


Сделано несколько вещей, но на самом деле не существует набора или исправления предварительной обработки, которая всегда выполнялась бы.

Вот некоторые примеры:

  • Вычтите среднее изображение,
  • Разделить на дисперсию (реже)
  • Нормализовать значения
  • при работе с "реальными" изображениями (например, с изображением людей) горизонтальное переворачивание
  • случайные культуры
  • переводы
person Steven    schedule 28.11.2016
comment
Привет, Стивен, что касается нормализации значений, это похоже на то, что мы обычно делаем в статистике, нормализуя значения пикселей до [0, 1]? - person user288609; 29.11.2016
comment
да, под нормализацией я имею в виду именно это. Значения между [0,1], тогда как вычесть среднее и разделить на дисперсию поместят вас в диапазон [-1,1] - person Steven; 30.11.2016