предварительная обработка изображений для классификации изображений и семантической сегментации

Что касается обучения моделей глубокого обучения для различных типов работ, связанных с изображениями, таких как классификация изображений, семантическая сегментация, какие работы по предварительной обработке необходимо выполнить?

Например, если я хочу обучить сеть семантической сегментации, нужно ли мне масштабировать значение изображения (обычно представленное как nd-массив) до диапазона [0,1] или сохранять его как диапазон [0,255]? Спасибо.

user288609 28.11.2016 источник

comment

Обычно люди масштабируют изображение. - malreddysid 29.11.2016

comment

Спасибо за комментарии. Вы имеете в виду масштабирование изображения до предопределенного диапазона, например [0,1]? Хотели бы вы подробнее рассказать? - user288609 29.11.2016

comment

да. Масштабируйте его до [0,1]. - malreddysid 29.11.2016

comment

И вычтите среднее изображение. - malreddysid 29.11.2016

comment

Большое спасибо за ваше разъяснение. - user288609 29.11.2016

Ответы (1)

arrow_upward
0
arrow_downward

Сделано несколько вещей, но на самом деле не существует набора или исправления предварительной обработки, которая всегда выполнялась бы.

Вот некоторые примеры:

Вычтите среднее изображение,
Разделить на дисперсию (реже)
Нормализовать значения
при работе с "реальными" изображениями (например, с изображением людей) горизонтальное переворачивание
случайные культуры
переводы

Steven 28.11.2016

comment

Привет, Стивен, что касается нормализации значений, это похоже на то, что мы обычно делаем в статистике, нормализуя значения пикселей до [0, 1]? - user288609; 29.11.2016

comment

да, под нормализацией я имею в виду именно это. Значения между [0,1], тогда как вычесть среднее и разделить на дисперсию поместят вас в диапазон [-1,1] - Steven; 30.11.2016

предварительная обработка изображений для классификации изображений и семантической сегментации

Ответы (1)

Вопросы по теме