Как упоминалось здесь, перекрестная энтропия не является подходящей функцией потерь для многокомпонентная классификация. У меня вопрос: «Верно ли это и для кросс-энтропии с softmax?». Если да, то как его можно сопоставить с этой частью документ.
Я должен упомянуть, что объем моего вопроса находится в cntk.