Шаг — это то, как сверточный фильтр перемещается по исходному изображению. Фильтр перемещается по изображению слева направо, сверху вниз, с изменением столбца на один пиксель при горизонтальном перемещении, затем изменение строки на один пиксель при вертикальном перемещении. Изменяя шаг, мы могли бы каждый раз перемещать наш фильтр на размер пикселя, что приводило к меньшему количеству возможных местоположений для фильтра. Шаг по умолчанию в двух измерениях равен (1,1) для движения по высоте и ширине, и в большинстве случаев он работает хорошо.

Объединение

Слой пула — это новый слой, добавляемый после сверточного слоя. В частности, после применения нелинейности к картам объектов, выводимым сверточным слоем. Объединение включает в себя выбор операции объединения. Две общие функции, используемые в операции объединения, — это объединение среднего и максимального объединения.

Слой пула — последний элемент в архитектуре CNN. Этот слой предназначен для существенного уменьшения выборки предыдущих сверточных слоев. Идея заключается в том, что предыдущие сверточные слои будут находить шаблоны, такие как края или другие основные формы, присутствующие на изображениях. Оттуда объединяющие слои будут брать сводку сверток из большего раздела. Пул среднего и максимального пула вычисляет среднее и максимальное значение для каждого патча на карте объектов соответственно. На практике максимальный пул работает лучше, чем средний пул, поскольку мы обычно пытаемся определить, присутствует ли функция в этом регионе. Понижающая выборка необходима для обеспечения приемлемого времени выполнения при обучении модели.