У меня уже есть приложение, которое берет входные изображения, копирует их в GPU, а затем к этому изображению применяются некоторые фильтры CUDA. Итак, когда я хочу реализовать новый фильтр, я пишу только сам фильтр (т.е. ядро), так как логика копирования CPU-GPU уже есть.
Теперь я хочу попробовать Halide для написания фильтров изображений для CUDA, и я столкнулся с проблемой, что Halide::Buffer, который представляет входное изображение, выделяется на ЦП, поэтому мне придется изменить существующую логику копирования.
Есть ли способ инициализировать Halide::Buffer данными, которые уже находятся на GPU, и избежать дополнительного копирования.