Тренировочная модель кераса; почему mae уменьшается, а mse увеличивается?

Я обучаю модель с использованием кераса для решения задачи регрессии. Когда я исследую потери и показатели во время обучения, иногда mean absolute error (mae) уменьшается в конце эпохи, а mean square error (mse) увеличивается. Я установил mae как убыток и mse как метрику.

Это нормально? Или есть проблемы с настройкой? Спасибо


person user153245    schedule 13.03.2018    source источник


Ответы (1)


MSE и MAE - разные показатели. Уменьшение одного не означает уменьшения другого. Рассмотрим следующий игрушечный пример для выходных значений размера 2 сети с целевым значением как Target: [0,0]

  • Временной шаг 1: Output: [2,2], MAE: 2, MSE: 4
  • Временной шаг 2: Output: [0,3], MAE: 1,5, MSE: 4,5

Таким образом, MAE уменьшилась, а MSE увеличилась. Учитывая, что вы оптимизируете для MAE и отслеживаете только MSE, ваше наблюдение в порядке и не подразумевает никаких проблем.

person KiraMichiru    schedule 14.03.2018
comment
Я думаю, что в этом примере есть ошибка. MAE и MSE должны применяться к ошибке. В T1: MAE: 1, MSE: 1. И в T2 MAE: 1,5, MSE: 2,5. Таким образом, увеличились как MAE, так и MSE. - person user153245; 15.03.2018
comment
Конечно спасибо, редактировал. Цель была неправильной. - person KiraMichiru; 15.03.2018
comment
@KiraMichiru, если моя цель - одно число: target = a, мой прогноз - p_a. MAE = abs (a - p_a), MSE = (a - p_a) ^ 2. MAE и MSE должны увеличиваться или уменьшаться одновременно? - person scott huang; 24.03.2018
comment
@scotthuang Если вы рассматриваете только одну точку данных с одним измерением, то вы правы. Однако значимость mean в MAE и MSE заключается в том, что они обычно применяются более чем к одной точке данных, например ко всем точкам данных в пакете. Затем, если каждая точка данных имеет одно измерение, операция усреднения между разными точками данных может привести к такому же поведению, как показано в примере. - person KiraMichiru; 24.03.2018
comment
@KiraMichiru, понял. Я забыл, что даже если у меня есть только число, я фактически вычисляю пакет данных. - person scott huang; 24.03.2018