LBP - это локальные шаблоны, которые описывают отношения между пикселем и его окрестностями.

Локальные двоичные шаблоны (LBP) использовались для широкого спектра приложений, начиная от обнаружения лиц [1], [2], распознавания лиц [3], распознавания выражений лиц [4], обнаружения пешеходов [5], до дистанционного зондирования и классификация текстур [6] среди прочего для создания мощных систем визуального обнаружения объектов [7]. В литературе было предложено множество вариантов LBP [8]. Однако наиболее распространенный подход требует, чтобы каждое окно 3 × 3 в изображении обрабатывалось для извлечения кода LBP. Обработка включает определение порога для центрального пикселя этого окна с окружающими его пикселями с использованием среднего значения окна, медианы окна или фактического центрального пикселя в качестве пороговых значений. Затем код LBP задается уравнением 1, где I_thresh - это выбранное пороговое значение, а I_n - интенсивности пикселей окружающего окна с (n = 0,1,…, 7).

Общий процесс состоит из следующих шагов (показанных на рисунке 1): 1) Порог значений в окрестности (окно изображения) с выбранным порогом, помещая 1, где значение больше или равно пороговому значению. и 0 в противном случае. 2) Умножение результирующей двоичной карты на предопределенную маску (обычно с возрастающей степенью двойки). 3) Суммируйте значения, чтобы получить 8-битный код LBP.

Результатом обработки LBP является изображение, собранное с помощью функций LBP. Следующий шаг к созданию дескриптора на основе LBP требует разделения изображения на основе LBP на k блоков пикселей W_width × W_height (например, 2 × 4,4 × 4,8 × 8). Для каждого блока изображения создается локальная гистограмма, чтобы построить локальные дескрипторы изображения. Затем локальные гистограммы объединяются в единую глобальную гистограмму, как показано на рисунке 2. Подход глобальной гистограммы эффективно выражает информацию на трех разных уровнях: отдельный код LBP содержит информацию на уровне пикселей, локальные гистограммы содержат информацию о региональный уровень, а составные региональные гистограммы содержат глобальное описание. Таким образом, результирующая гистограмма кодирует как локальные, так и глобальные характеристики в компактном представлении, что делает ее более устойчивой к изменениям положения объекта и освещения.

Каждая локальная гистограмма измеряет наличие каждого из 256 возможных кодов LBP в блоке. Количество интервалов, необходимых для описания гистограммы, можно определить по полученной точности после фаз обучения и тестирования. Когда используются все 256 интервалов, это приведет к получению длинного дескриптора гистограммы, который потребует больших вычислительных ресурсов и памяти. В качестве альтернативы, Ojala и др. Предлагают концепцию однородных и неоднородных шаблонов, чтобы уменьшить количество возможных шаблонов LBP и улучшить способность распознавания. Паттерн LBP называется равномерным, если он имеет 2 или менее перехода, например. 11110000, и неоднородный, если имеет более двух переходов, например 10100101. Было замечено, что текстурированные изображения состоят в основном из однородных узоров. Это также относится к изображениям объектов, поскольку их можно рассматривать как композицию микротекстур. Следовательно, гистограмма делится на 59 интервалов вместо возможных 256, где один интервал предназначен для всех неоднородных шаблонов, а остальные назначаются для оставшихся 58 одинаковых шаблонов. Общий дескриптор гистограммы может использоваться для подачи соответствующего классификатора или дискриминантной схемы, такой как вспомогательные векторные машины, для выполнения обнаружения объекта.

ССЫЛКИ

  1. А. Хадид, М. Пиетикайнен и Т. Ахонен, «Пространство дискриминационных признаков для обнаружения и распознавания лиц», в IEEE Conf. по компьютерному зрению и распознаванию образов, 2004, стр. 797–804.
  2. Б. Фроба и А. Эрнст, «Обнаружение лиц с модифицированным преобразованием переписи», в IEEE Int. Конф. по автоматическому распознаванию лиц и жестов, 2004, стр. 91–96.
  3. Т. Ахонен, А. Хадид и М. Пиетикайнен, «Описание лица с помощью локальных двоичных шаблонов. Приложение для распознавания лиц», IEEE Trans. по анализу шаблонов и машинному интеллекту, т. 28, вып. 12. С. 2037–2041, 2006.
  4. Кайфэн Шань, Шаоган Гун и Питер В. МакОван, «Распознавание выражения лица на основе локальных двоичных паттернов: всестороннее исследование», «Вычисления изображений и зрения», т. 27, нет. 6. С. 803–816, 2009.
  5. Му Ядун, Ян Шуйчэн, И Лю, Т. Хуанг и Чжоу Бинфэн, «Дискриминационные локальные двоичные шаблоны для обнаружения человека в личном альбоме», в IEEE Conf. onComputer Vision and Pattern Recognition, 2008, pp. 1–8.
  6. Ли Лю, Линцзюнь Чжао, Юнли Лонг, Ганъяо Куанг и Пол Фигут, «Расширенные локальные двоичные шаблоны для классификации текстур», Image and Vision Computing, vol. 30, нет. 2. С. 86–99, февраль 2012 г.
  7. Иржи Трефни и Иржи Матас, «Расширенный набор локальных двоичных шаблонов для быстрого обнаружения объектов», в Зимнем семинаре по компьютерному зрению, 2010 г.
  8. Матти Пиетикайнен, Хадид Абденур, Гоин Чжао и Тимо Ахонен, Компьютерное зрение с использованием локальных двоичных шаблонов: Springer, 2011.