У меня есть предварительно обученная модель кафе без слоев потерь. Я хочу сделать следующие шаги:
- Вычислите стоимость / градус некоторого слоя в сети.
- Обратное распространение для вычисления градиента относительно входного слоя.
- Выполните градиентный спуск, повторяя 1 и 2, чтобы оптимизировать ввод.
Я не могу понять, как для этого добавить слой потерь в предварительно обученную модель. В других структурах NN вы можете вызвать функцию backward () и передать функцию стоимости. Есть ли способ сделать это в кафе?