Какие функции Хаара используются при распознавании лиц?

Распознавание лица означает идентификацию человека, а проверка лица означает проверку личности, которая заявлена ​​как личность (путем сопоставления его в определенной базе данных). Его приложения находят применение в различных областях, таких как школы, колледжи, организации, фабрики, общественные места, наблюдение и т. Д. Эти методы набирают обороты во всем мире и расширяются с помощью распознавания человеческих эмоций, их применения огромны.

Ключевым аспектом распознавания лиц является обнаружение соответствующих черт человеческого лица, таких как глаза, брови, нос, губы. Итак, как мы обнаруживаем эти особенности в реальном времени / на изображении? Ответ - Вейвлеты Хаара или особенности Хаара. И используемый алгоритм называется алгоритмом Виолы-Джонса. В этой статье мы попытаемся разобраться, что такое функции Хаара и как они используются при распознавании лиц.

Функции Хаара представляют собой последовательность масштабированных функций квадратной формы, предложенных Альфредом Хааром в 1909 году. Они похожи на ядра свертки, изучаемые в курсе нейронных сетей свертки. Мы применим эти особенности волос ко всем соответствующим частям лица, чтобы распознавать человеческое лицо.

Как мы видим на изображении выше, есть краевые элементы (1 и 2), линейные элементы (3). Это изображения белых и черных пикселей (значение 0 или значение 1). Но обычно у нас есть изображение в оттенках серого / цветное (диапазон значений пикселей от 0 до 255). А пока предположим, что в идеальном сценарии у нас есть черно-белое изображение.

Чтобы обнаружить бровь, мы будем использовать функцию Хаара (изображение (1)), потому что лоб и бровь образуют более светлые пиксели - более темные пиксели, подобные изображению. Точно так же, чтобы обнаружить губы, мы используем функцию, похожую на функцию Хаара (изображение (3)), с более светлыми-темными-светлыми пикселями. Чтобы обнаружить нос, мы могли бы использовать более темную и более светлую функцию Харра из (изображение (1)). И так далее.

Давайте посмотрим на некоторые необходимые вычисления.

Для черно-белого изображения (см. Первое поле ниже) значения пикселей равны 0 или 1 (идеальный случай), но в реальных случаях мы имеем нормализованное изображение в оттенках серого, как показано в нижнем поле, содержащем значения пикселей.

Согласно алгоритму Виолы-Йонаса, чтобы обнаружить характерную черту Хаара, присутствующую на изображении, приведенная ниже формула должна давать результат ближе к 1. Чем ближе значение к 1, тем больше изменение обнаружения характерной черты Хаара на изображении.

Идеальный случай: Дельта = (1/8) * (8) - (1/8) * 0 = 1

Реальный случай: Дельта = (1/8) * (5,9) - (1/8) * (1,3) = 0,575

(Для изображения в оттенках серого предположим, что мы установили порог «Белый-Темный» на 0,3. Это означает, что пиксели со значением меньше или равным 0,3 считаются белыми, а все, что больше 0,3, считается темным)

Мы можем определить еще один пороговый параметр для обнаружения края или особенности Хаара. Мы называем его Дельта (это отличается от порога белого-темного). Предположим, здесь мы установили порог 0,5. Любое значение дельты больше 0,5 определяет функцию Хаара. Таким образом мы можем применить, получить и обнаружить наиболее важные элементы данного изображения, такие как бровь, губы, нос и т. Д.

Затем мы быстро узнаем, что такое каскадные классификаторы Хаара -

Они представляют собой серию классификаторов или функций (как мы видели выше), используемых для идентификации объекта на изображении. Использование скользящих окон и количества черт лица (увеличивается с увеличением количества этапов), что в конечном итоге приводит к обнаружению лица или нет. Всего для метода Виолы Йонаса определено 38 этапов. В зависимости от размера скользящих окон и расположения лица, количества черт лица лицо может быть обнаружено на определенном этапе.

Надеюсь, у вас есть некоторая интуиция в понимании функции Хаара, используемой при распознавании лиц. Я изо всех сил старался упростить термины. Если есть вопросы, пишите в комментариях. Буду рад ответить.

Спасибо, что прочитали статью.