Публикации по теме 'convolutional-network'


Сверточная нейронная сеть (CNN) (I)
Сверточная нейронная сеть — это большая шишка в машинном обучении. Возможно, вы слышали о «вычислительном зрении», «распознавании лиц», «обработке графики» и так далее — да! Они все исходят от CNN! Эти термины могут показаться пугающими, в то время как логику и концепции на самом деле несложно понять. Полносвязная нейронная сеть и сверточная нейронная сеть Прежде чем представить CNN, давайте рассмотрим, что такое нейронные сети. Нейронная сеть (или нейронные сети) — это инструмент..

Размер карты активации CNN
В других местах есть много подробных объяснений, поэтому здесь я хотел бы поделиться некоторыми примерами вопросов в условиях интервью . 1. Для входного изображения 7 на 7 на 1, если бы мы использовали сверточный фильтр размером 3 и шагом 1, как бы выглядел размер выходной карты активации? (Предположим, что на границе нет нуля.) 2. Для входного изображения 7 на 7 на 1, если бы мы использовали размер фильтра свертки 3 и шаг 3, как бы выглядел размер выходной карты..

Основы сверточных нейронных сетей — Stride and Pooling
Шаг — это то, как сверточный фильтр перемещается по исходному изображению. Фильтр перемещается по изображению слева направо, сверху вниз, с изменением столбца на один пиксель при горизонтальном перемещении, затем изменение строки на один пиксель при вертикальном перемещении. Изменяя шаг, мы могли бы каждый раз перемещать наш фильтр на размер пикселя, что приводило к меньшему количеству возможных местоположений для фильтра. Шаг по умолчанию в двух измерениях равен (1,1) для движения по..

MiCT-Net для распознавания действий человека в видеороликах
Как смешивать 3D- и 2D-свертки с использованием остаточных кросс-доменных связей Недавно группа исследователей из Microsoft опубликовала статью [1], в которой была представлена ​​гибридная архитектура сверточной нейронной сети 3D / 2D для распознавания действий человека в видео. В документе сообщается о современных характеристиках наборов данных UCF-101 и HMDB-51 при одновременном снижении сложности модели за счет использования вдвое меньшего количества трехмерных сверток, чем в..

Архитектура CNN, глубокое погружение
Реализация всех популярных архитектур CNN. В глубоком обучении сверточная нейронная сеть (CNN) - это класс глубоких нейронных сетей, которые чаще всего применяются для анализа визуальных образов. Сверточные нейронные сети - это современные модели для классификации изображений, сегментации, обнаружения объектов и многих других задач обработки изображений. Чтобы начать работу в области обработки изображений или повысить точность прогнозирования пользовательских моделей CNN,..

Самовнимание в компьютерном зрении
С момента появления Трансформаторных сетей механизм внимания в глубоком обучении пользуется большой популярностью как в сообществах машинного перевода, так и в сообществах НЛП. Однако в компьютерном зрении сверточные нейронные сети (CNN) по-прежнему являются нормой, и самовнимание только начало постепенно проникать в основную часть исследований, либо дополняя существующие архитектуры CNN, либо полностью заменяя их. В этом посте я постараюсь осветить последние достижения в области..

Простое руководство по калибровке эквивалентных сверточных сетей
Геометрическое глубокое обучение - это очень захватывающая новая область, но его математика постепенно уходит в область алгебраической топологии и теоретической физики. Это особенно верно для статьи Cohen et. al. ( https://arxiv.org/abs/1902.04615 ), который я хочу изучить в этой статье. В статье используется язык калибровочной теории, которая лежит в основе всего, что в физике любит использовать вместе слова квант и поле . Он обещает дать интуитивное понимание основ калибровочной..