В других местах есть много подробных объяснений, поэтому здесь я хотел бы поделиться некоторыми примерами вопросов в условиях интервью.

1. Для входного изображения 7 на 7 на 1, если бы мы использовали сверточный фильтр размером 3 и шагом 1, как бы выглядел размер выходной карты активации? (Предположим, что на границе нет нуля.)

2. Для входного изображения 7 на 7 на 1, если бы мы использовали размер фильтра свертки 3 и шаг 3, как бы выглядел размер выходной карты активации? (Предположим, что на границе нет нуля.)

Вот несколько примеров ответов для ознакомления читателей:

Вопрос 1:

В этом случае мы получим вывод 5x5.

Посмотрите объяснениеDr. Серена Йенгиз Стэнфорда:

Смотри объяснение!

Вопрос 2.

Ответ простой: в этом случае свертка не сработает.

Посмотрите объяснениеDr. Серена Юнгиз Стэнфорда:

Смотри объяснение!

Удачной практики!

Спасибо, что читаете мою рассылку. Вы можете подписаться на меня в Linkedin!

Примечание. Существуют разные точки зрения на вопрос интервью. Автор этого информационного бюллетеня не пытается найти ссылку, исчерпывающе отвечающую на вопрос. Скорее, автор хотел бы поделиться некоторыми быстрыми выводами и помочь читателям подумать, попрактиковаться и провести дополнительные исследования по мере необходимости.

Источник видео/ответов: Stanford CS231, лекция 5 | Сверточные нейронные сети для визуального распознавания от Fei-Fei Li, Serena Yeung

Источник изображений: Размер изображения свертки, размер фильтра, отступы и шаг, Джеймс Д. Маккефри, Пост в блоге. 6 основных вещей, которые нужно знать о Convolution