В других местах есть много подробных объяснений, поэтому здесь я хотел бы поделиться некоторыми примерами вопросов в условиях интервью.
1. Для входного изображения 7 на 7 на 1, если бы мы использовали сверточный фильтр размером 3 и шагом 1, как бы выглядел размер выходной карты активации? (Предположим, что на границе нет нуля.)
2. Для входного изображения 7 на 7 на 1, если бы мы использовали размер фильтра свертки 3 и шаг 3, как бы выглядел размер выходной карты активации? (Предположим, что на границе нет нуля.)
Вот несколько примеров ответов для ознакомления читателей:
Вопрос 1:
В этом случае мы получим вывод 5x5.
Посмотрите объяснениеDr. Серена Йенгиз Стэнфорда:
Вопрос 2.
Ответ простой: в этом случае свертка не сработает.
Посмотрите объяснениеDr. Серена Юнгиз Стэнфорда:
Удачной практики!
Спасибо, что читаете мою рассылку. Вы можете подписаться на меня в Linkedin!
Примечание. Существуют разные точки зрения на вопрос интервью. Автор этого информационного бюллетеня не пытается найти ссылку, исчерпывающе отвечающую на вопрос. Скорее, автор хотел бы поделиться некоторыми быстрыми выводами и помочь читателям подумать, попрактиковаться и провести дополнительные исследования по мере необходимости.
Источник видео/ответов: Stanford CS231, лекция 5 | Сверточные нейронные сети для визуального распознавания от Fei-Fei Li, Serena Yeung
Источник изображений: Размер изображения свертки, размер фильтра, отступы и шаг, Джеймс Д. Маккефри, Пост в блоге. 6 основных вещей, которые нужно знать о Convolution