Обычно предварительно обученные сети, такие как VGG16 / Inception и т. Д., Работают с низким разрешением, например ‹500px.
Можно ли добавить сверточный слой (или два) с высоким разрешением перед самым первым слоем предварительно обученного VGG16 / Inception, чтобы сеть могла потреблять изображения с высоким разрешением?
Насколько я знаю - первые уровни труднее всего обучать, для обучения требовалось много данных и ресурсов.
Интересно, удастся ли заморозить предварительно обученную сеть и обучить только недавно подключенный слой с высоким разрешением на средней карте графического процессора и около 3000 примеров? Можно ли это сделать за пару часов?
Также, если вы знаете какие-либо примеры использования изображений с высоким разрешением для классификации изображений, поделитесь ссылкой.
P.S.
Проблема с обычным подходом к уменьшению масштаба заключается в том, что в нашем случае очень важны крошечные детали, такие как крошечные трещины или крошечные точки грязи, и они теряются на изображениях с более низким разрешением.