Я запустил модель классификатора повышения градиента воды, чтобы предсказать вероятности для трех классов 0,1 и 2. В обучающих данных наблюдается значительный дисбаланс классов (93: 5: 2).
Хотя отдельные классы 1 и 2 неправильно предсказаны в матрице путаницы (как и ожидалось), AUC приемлем для этих классов по отдельности.
Планирую вручную предсказать финальные классы
Насколько я понимаю, результирующие вероятности (P0, P1 и P2) откалиброваны и в сумме равны 1.
Поскольку полиномиальная модель в воде - это, по сути, подход «один против многих», но сумма баллов составляет 1, правильно ли складывать или сравнивать вероятности?
Итак, если P0 = 0,40, P1 = 0,35 и P2 = 0,25, прогнозируемый класс будет 0 (на основе максимальной вероятности).
Означает ли это, что P (1,2) = 0,6 или p (не 0) = 0,6? (Поскольку модель для класса 0 фактически равна 0 по сравнению со всеми другими классами)
Могу ли я затем сравнить вероятности 1 и 2 и сказать P1 (0,35) ›P2 (0,25), поэтому прогнозируемый класс должен быть 1? (Поскольку результирующие классы являются взаимоисключающими, а вероятности в сумме составляют 1, будут ли они сопоставимы?)