LBP - это локальные шаблоны, которые описывают отношения между пикселем и его окрестностями.
Локальные двоичные шаблоны (LBP) использовались для широкого спектра приложений, начиная от обнаружения лиц [1], [2], распознавания лиц [3], распознавания выражений лиц [4], обнаружения пешеходов [5], до дистанционного зондирования и классификация текстур [6] среди прочего для создания мощных систем визуального обнаружения объектов [7]. В литературе было предложено множество вариантов LBP [8]. Однако наиболее распространенный подход требует, чтобы каждое окно 3 × 3 в изображении обрабатывалось для извлечения кода LBP. Обработка включает определение порога для центрального пикселя этого окна с окружающими его пикселями с использованием среднего значения окна, медианы окна или фактического центрального пикселя в качестве пороговых значений. Затем код LBP задается уравнением 1, где I_thresh - это выбранное пороговое значение, а I_n - интенсивности пикселей окружающего окна с (n = 0,1,…, 7).
Общий процесс состоит из следующих шагов (показанных на рисунке 1): 1) Порог значений в окрестности (окно изображения) с выбранным порогом, помещая 1, где значение больше или равно пороговому значению. и 0 в противном случае. 2) Умножение результирующей двоичной карты на предопределенную маску (обычно с возрастающей степенью двойки). 3) Суммируйте значения, чтобы получить 8-битный код LBP.
Результатом обработки LBP является изображение, собранное с помощью функций LBP. Следующий шаг к созданию дескриптора на основе LBP требует разделения изображения на основе LBP на k блоков пикселей W_width × W_height (например, 2 × 4,4 × 4,8 × 8). Для каждого блока изображения создается локальная гистограмма, чтобы построить локальные дескрипторы изображения. Затем локальные гистограммы объединяются в единую глобальную гистограмму, как показано на рисунке 2. Подход глобальной гистограммы эффективно выражает информацию на трех разных уровнях: отдельный код LBP содержит информацию на уровне пикселей, локальные гистограммы содержат информацию о региональный уровень, а составные региональные гистограммы содержат глобальное описание. Таким образом, результирующая гистограмма кодирует как локальные, так и глобальные характеристики в компактном представлении, что делает ее более устойчивой к изменениям положения объекта и освещения.
Каждая локальная гистограмма измеряет наличие каждого из 256 возможных кодов LBP в блоке. Количество интервалов, необходимых для описания гистограммы, можно определить по полученной точности после фаз обучения и тестирования. Когда используются все 256 интервалов, это приведет к получению длинного дескриптора гистограммы, который потребует больших вычислительных ресурсов и памяти. В качестве альтернативы, Ojala и др. Предлагают концепцию однородных и неоднородных шаблонов, чтобы уменьшить количество возможных шаблонов LBP и улучшить способность распознавания. Паттерн LBP называется равномерным, если он имеет 2 или менее перехода, например. 11110000, и неоднородный, если имеет более двух переходов, например 10100101. Было замечено, что текстурированные изображения состоят в основном из однородных узоров. Это также относится к изображениям объектов, поскольку их можно рассматривать как композицию микротекстур. Следовательно, гистограмма делится на 59 интервалов вместо возможных 256, где один интервал предназначен для всех неоднородных шаблонов, а остальные назначаются для оставшихся 58 одинаковых шаблонов. Общий дескриптор гистограммы может использоваться для подачи соответствующего классификатора или дискриминантной схемы, такой как вспомогательные векторные машины, для выполнения обнаружения объекта.
ССЫЛКИ
- А. Хадид, М. Пиетикайнен и Т. Ахонен, «Пространство дискриминационных признаков для обнаружения и распознавания лиц», в IEEE Conf. по компьютерному зрению и распознаванию образов, 2004, стр. 797–804.
- Б. Фроба и А. Эрнст, «Обнаружение лиц с модифицированным преобразованием переписи», в IEEE Int. Конф. по автоматическому распознаванию лиц и жестов, 2004, стр. 91–96.
- Т. Ахонен, А. Хадид и М. Пиетикайнен, «Описание лица с помощью локальных двоичных шаблонов. Приложение для распознавания лиц», IEEE Trans. по анализу шаблонов и машинному интеллекту, т. 28, вып. 12. С. 2037–2041, 2006.
- Кайфэн Шань, Шаоган Гун и Питер В. МакОван, «Распознавание выражения лица на основе локальных двоичных паттернов: всестороннее исследование», «Вычисления изображений и зрения», т. 27, нет. 6. С. 803–816, 2009.
- Му Ядун, Ян Шуйчэн, И Лю, Т. Хуанг и Чжоу Бинфэн, «Дискриминационные локальные двоичные шаблоны для обнаружения человека в личном альбоме», в IEEE Conf. onComputer Vision and Pattern Recognition, 2008, pp. 1–8.
- Ли Лю, Линцзюнь Чжао, Юнли Лонг, Ганъяо Куанг и Пол Фигут, «Расширенные локальные двоичные шаблоны для классификации текстур», Image and Vision Computing, vol. 30, нет. 2. С. 86–99, февраль 2012 г.
- Иржи Трефни и Иржи Матас, «Расширенный набор локальных двоичных шаблонов для быстрого обнаружения объектов», в Зимнем семинаре по компьютерному зрению, 2010 г.
- Матти Пиетикайнен, Хадид Абденур, Гоин Чжао и Тимо Ахонен, Компьютерное зрение с использованием локальных двоичных шаблонов: Springer, 2011.