Что такое хорошая библиотека компьютерного зрения для Python, которая позволит мне находить лица в видео Flash/HTML5?

Мне нужно разработать сценарий с использованием компьютерного зрения, который будет:

  1. Сканировать все кадры видео Flash/HTML5 на наличие лиц людей
  2. Определите видеокадры, на которых показаны лица, смотрящие прямо в камеру.
  3. Обрежьте лицо в идеальный квадрат
  4. Скопируйте обрезанное лицо в файл .PNG.

Любые рекомендации для библиотеки компьютерного зрения Python, которая могла бы помочь мне разработать этот сценарий?


person Community    schedule 09.11.2010    source источник


Ответы (2)


Как Джонси сказал, что opencv - ваш лучший выбор для распознавания лиц "из коробки".

Чтобы использовать флэш-видео в качестве ввода, вам понадобится что-то, что позволит вам читать файлы .flv (флеш-видео), которые вы можете подключить к opencv. Я не пробовал это сам, но я думаю, что если вы установите opencv с поддержкой ffmpeg (если вы работаете в Linux), вы сможете читать почти любое видео с opencv, включая .flv (или любой видеоформат html5).

Для обрезки это объясняет, что вы хотите. Чтобы сохранить обрезанное изображение в формате png, проверьте документацию imwrite.

person jilles de wit    schedule 09.11.2010
comment
jilles большое спасибо, как насчет обрезки и сохранения в формате .png. возможно ли это с openCV или мне нужно что-то вроде библиотеки изображений Python? - person ; 09.11.2010

OpenCV, вероятно, является лучшим вариантом для вашего конкретного случая использования: http://opencv.willowgarage.com/wiki/

Он имеет некоторую встроенную поддержку стандартных алгоритмов распознавания лиц, и его довольно легко настроить и использовать в Python. Однако, хотя это довольно глубокая библиотека, я почти уверен, что вам придется найти что-то еще, чтобы сначала получить изображения из Flash и передать их вашей утилите. Я тоже не уверен в обрезке, но для такого рода вещей я уверен, что библиотека изображений Python будет работать, если OpenCV этого не сделает.

Надеюсь это поможет.

person jonesy    schedule 09.11.2010
comment
jonesy, поэтому мне понадобится инструмент, чтобы иметь возможность просеивать все видеокадры, а затем передавать эти кадры в компонент распознавания лиц OpenCV. благодаря. Я поддержу вопрос некоторое время, чтобы узнать, может ли кто-нибудь предоставить какую-либо другую информацию о том, что может быть другой библиотекой Python (которая поможет искать кадры видео). - person ; 09.11.2010
comment
@ J3M - да, это мое понимание этого, и, судя по тому, что я видел, работая по краям проектов, включающих такие функции, это не особенно просто в зависимости от вашего варианта использования. Наиболее успешное решение было найдено в магазине, который использовал инструменты Adobe для захвата изображений. - person jonesy; 09.11.2010
comment
jonesy, о каких инструментах Adobe вы конкретно говорите? потребуется ли сценарий действий? - person ; 09.11.2010
comment
@ J3M - Честно говоря, я не знаю ответа на этот вопрос, J3M. Прости. - person jonesy; 09.11.2010