Caffe вычисляет градиент по отношению к вводу с использованием настраиваемой функции стоимости

У меня есть предварительно обученная модель кафе без слоев потерь. Я хочу сделать следующие шаги:

  1. Вычислите стоимость / градус некоторого слоя в сети.
  2. Обратное распространение для вычисления градиента относительно входного слоя.
  3. Выполните градиентный спуск, повторяя 1 и 2, чтобы оптимизировать ввод.

Я не могу понять, как для этого добавить слой потерь в предварительно обученную модель. В других структурах NN вы можете вызвать функцию backward () и передать функцию стоимости. Есть ли способ сделать это в кафе?


person PandaBearSoup    schedule 18.04.2016    source источник


Ответы (1)


Вы можете создать собственный слой в caffe для своей функции затрат. Выполните вызов этой функции стоимости в файле .prototxt. Вы можете точно настроить предварительно обученную модель, используя новую функцию стоимости.

Тонкая настройка выполняется с использованием следующего формата кода командной строки:

./build/tools/caffe train --solver theAboveMentioned.prototxt --weights thePreTrainedWeightsFile

Дополнительную информацию о настройке кафе можно найти здесь.

person Anoop K. Prabhu    schedule 19.04.2016