пользовательская функция потери отличается от стандартной

Я пытаюсь понять, как создать пользовательскую функцию потерь, и первое, что я попробовал, — это повторно реализовать функцию binary_crossentropy в keras. В моем коде, если я это сделаю:

model.compile(Adam(lr=learning_rate), loss=losses.binary_crossentropy, metrics=['accuracy'])

модель компилируется нормально и быстро обучается, достигая точности более 95% в первую эпоху и потери 0,2

Когда я создаю пользовательскую функцию потерь, которая в основном повторяет loss.binary_crossentropy:

def custom_loss(y_true,y_pred):
        return K.mean(K.binary_crossentropy(y_pred, y_true), axis=-1)

а потом:

model.compile(Adam(lr=learning_rate), loss=custom_loss, metrics=['accuracy'])

когда я подбираю, потери довольно высоки (0,65), а точность низкая (0,47). Процедура подгонки и данные одинаковы в обоих случаях, поэтому кажется, что я неправильно объявляю свою функцию потерь. Я использую последние версии keras с бэкендом tensorflow, и моя модель представляет собой простую полную сверточную модель vgg16 (fcn 32).

keras tensorflow loss

Angel Lopez 31.05.2017 источник

comment

Вы всему заново учитесь? Покажите, как вы получаете тест и как вы получаете эту низкую точность, пожалуйста (достаточно кода, чтобы воспроизвести ваш результат) - Nassim Ben 01.06.2017

comment

Возможный дубликат Как написать пользовательскую функцию потерь в Tensorflow? < /а> - Salvador Dali 01.06.2017

comment

кажется проблемой, когда прогнозы представляют собой матрицу, а не вектор, я попытался сделать пример с простой моделью классификации, где y_pred y вектор, и он работает нормально. Сейчас я пытаюсь сделать воспроизводимый пример с матричными предсказаниями. Да, @NassimBen, я всему заново учусь - Angel Lopez 01.06.2017

Вопросы по теме

eventReactive с 2 кнопками действий на 2 вкладках
Добавить результат в TestCaseSource
три столбца в одну дату
Как открыть URL-адрес в WebView через .js в создателе кокосов
Highchart GMT и смещение в один час
проблема с отключением дат в datepicker
Получить описание текущего шага, вызываемого из файла BDD
журнал данных ракетки - журнал данных с отрицанием?
Не удается проиндексировать массив int RavenDB
Как использовать команду Scaffold-DbContext в VS Code
Взрывающийся градиент тензорного потока
Итерация по столбцу фрейма данных pandas и оценка с помощью оператора if и передача значений столбца в пустой список/словарь
Заполнить таблицу данных; Неверный ответ JSON
Получить точное время для удаленного сервера
Сбор элементов в массиве JSON
Динамический компонент круговой диаграммы D3 в Angular
Данные о пользовательских событиях в Firebase Events
Laravel 5.2 - проблема с веб-сервисами
Как повернуть трехмерный график в Matplotlib вокруг любой оси
Представление класса базы данных Java SQL