Я запускаю Tensorflow Object Detection API для обучения собственного детектора с помощью скрипта object_detection/train.py
, найденного здесь. Проблема в том, что я постоянно получаю CUDA_ERROR_OUT_OF_MEMORY
.
Я нашел несколько предложений по уменьшению размера пакета, чтобы тренер потреблял меньше памяти, но я уменьшил с 16 до 4, но все равно получаю ту же ошибку. Разница в том, что при использовании batch_size=16 ошибка возникала на шаге ~18, а теперь на шаге ~70. РЕДАКТИРОВАТЬ: установка batch_size=1 не решила проблему, так как я все еще получал ошибку на шаге ~2700.
Что я могу сделать, чтобы он работал гладко, пока я не остановлю процесс обучения? Мне не нужно быстро тренироваться.
EDIT: сейчас я использую для этого GTX 750 Ti 2 ГБ. Графический процессор не используется ни для чего другого, кроме как для обучения и предоставления изображения на мониторе. В настоящее время я использую только 80 изображений для обучения и 20 изображений для оценки.