Сказано, что «4916 положительных обучающих примеров были отобраны вручную, выровнены, нормализованы и масштабированы до базового разрешения 24x24. 10 000 отрицательных примеров были отобраны случайным образом путем выбора подокна из 9500 изображений, не содержащих лиц». В статье «Надежное обнаружение лиц в реальном времени Пол Виола и Майкл Джонс»
Мой вопрос в том, что они имеют в виду под вручную подобранным выровненным, нормализованным и масштабированным до базового разрешения 24x24?
Означает ли "выровненное от руки" 4916 положительных изображений 4916 разных лиц? Означает ли «нормализованный», что каждое из 4916 изображений имеет одинаковые характеристики [размер файла, тип файла, цвет изображения (шкала серого / цветное)]? Означает ли «масштабирование до базового разрешения 24x24», что размер каждого из 4916 изображений изменен до 24x24 пикселей?
Спасибо за ваше время!