Несколько недель назад я посетил вебинар Arrayfire, организованный NVIDIA, и инженеры представили несколько интересных графиков для сравнения производительности библиотеки ArrayFire с процессором OpenCV (1 поток) и графическим процессором (CUDA).
Обнаружение ключевых точек HARRIS
Обнаружение ключевых точек ORB
У меня была возможность спросить их, почему ускорение ArrayFire (по сравнению с однопоточной реализацией ЦП) уменьшается для больших изображений. Они ответили мне, что "это произошло из-за того, что ЦП OpenCV очень эффективно обрабатывал крупномасштабные данные" - без каких-либо технических подробностей.
У вас есть идеи о том, что они могут быть?