Я настраиваю гиперпараметры, используя настройку лучей. Модель построена в библиотеке tensorflow, занимает большую часть доступной памяти GPU. Я заметил, что каждый второй вызов сообщает об ошибке нехватки памяти. Похоже, что память освобождается, это видно на графике использования памяти GPU, это момент между вызовами последовательных испытаний, между которыми произошла ошибка OOM. Добавлю, что на моделях меньшего размера я не сталкивался с этой ошибкой, и график выглядит так же.
Как бороться с этой ошибкой нехватки памяти при каждой второй попытке?