взаимосвязь между ориентацией ключевых точек SIFT и ориентацией описания SIFT

Я использую открытый исходный код VLfeat для извлечения ключевых точек SIFT и их описаний. На изображении ниже показан один из них. Желтый диск указывает масштаб характерной точки (радиус) и ориентацию (линия). Зеленая рамка показывает его описание (т. е. 8-бинарную гистограмму ориентации 4x4).

Сам вопрос простой. Почему «ориентация ключевой точки (желтая линия)» здесь отличается от «основной (наиболее частой) ориентации в ее описании (самая популярная ячейка зеленого цвета)» здесь?

Насколько я понимаю, ориентация ключевой точки определяется пиковым градиентом пикселей среди окружающих. Тогда не должно ли быть естественным, чтобы ориентация также отображалась зеленым цветом? Это потому, что зеленая рамка намного больше, чем масштаб ключевой точки?

SIFT
(источник: молодой у меня .berkeley.edu)


person YW P Kwon    schedule 04.11.2014    source источник
comment
Извиняюсь. Я обновил ссылку на изображение.   -  person YW P Kwon    schedule 05.11.2014


Ответы (2)


Есть по крайней мере три вещи, которые следует учитывать, чтобы объяснить, почему это не должно быть так:

Первый заключается в том, что основная (желтая) ориентация имеет гистограмму 36 бинов, а дескрипторные (зеленые) ориентации — 8 бинов; это допускает ошибку в пару (~ 30) градусов.

Второй заключается в том, что гистограммы дескриптора (зеленые) рассчитываются после того, как область признака была повернута на ее основную (желтую) ориентацию, поэтому они, по крайней мере, были бы сдвинуты этим поворотом.

Но самая важная причина заключается в том, что обе ориентации рассчитываются из одной и той же области, но из разных окрестностей (разных по размеру и положению), поэтому их градиенты вовсе не обязательно должны быть одинаковыми.

person McMa    schedule 07.11.2014

Я думаю, что это просто вопрос визуализации, используемой в VLfeat. Как описано здесь standard
< sub>(источник: vlfeat.org)

стандартно ориентированная рамка будет визуализирована в виде круга с радиусом, направленным вниз.

То же самое относится и здесь. Если вы повернете кадр так, чтобы радиус был направлен вниз, то основное направление градиента кадра должно быть горизонтальным, что согласовано в большинстве гистограмм внутри квадратов 4x4.

Я думаю, что это соглашение имеет смысл, потому что радиус, направленный вниз, выровнен с основными штрихами рамки (что визуально интуитивно понятно), но ортогонален основному направлению градиента.

person Ying Xiong    schedule 07.11.2014