Публикации по теме 'video-classification'


MiCT-Net для распознавания действий человека в видеороликах
Как смешивать 3D- и 2D-свертки с использованием остаточных кросс-доменных связей Недавно группа исследователей из Microsoft опубликовала статью [1], в которой была представлена ​​гибридная архитектура сверточной нейронной сети 3D / 2D для распознавания действий человека в видео. В документе сообщается о современных характеристиках наборов данных UCF-101 и HMDB-51 при одновременном снижении сложности модели за счет использования вдвое меньшего количества трехмерных сверток, чем в..

Классификация видео в дикой природе с использованием метода трансфертного обучения
Введение Проблема классификации видео заключается в определении категории видео данного видео. Классификация видео — одна из сложных задач компьютерного зрения. Проблема классификации видео может рассматриваться как мультимодальная проблема, в которой для решения проблемы используются как изображения, так и звук. В прошлом было проделано много работы, связанной с классификацией видео, и обзор последних методов классификации видео можно увидеть в этой бумаге . В этом блоге я объясню..