У меня куча вопросов о том, как регуляризация и предвзятость работают в кафе.
Во-первых, в сети по умолчанию существуют тенденциозные, правильно ли это? Или мне нужно попросить кафе добавить их?
Во-вторых, когда он получает значение потерь, он не учитывает регуляризацию. это правильно? Я имею в виду, что потеря просто содержит значение функции потерь. Насколько я понял, он просто учитывает регуляризацию при расчете градиента. Это правильно?
В-третьих, когда caffe получает градиент, учитывает ли он также смещенное значение при регуляризации? Или он просто учитывает вес сети при регуляризации?
Заранее спасибо,
Афшин