Я обучал нейронную сеть на графическом процессоре (1080 ти). Скорость обучения на GPU намного лучше, чем на CPU.
В настоящее время я хочу обслуживать эту модель с помощью TensorFlow Serving. Мне просто интересно узнать, влияет ли использование графического процессора в процессе обслуживания на производительность?
Поскольку обучение применяется к пакетам, но при выводе (обслуживании) используются асинхронные запросы, можете ли вы использовать графический процессор для обслуживания модели с использованием обслуживания TensorFlow?