Модель обучения на yolov3-tiny, но средний проигрыш всегда равен -nan

Я экспериментирую с yolov3-tiny с даркнетом на windows 10 с процессором. Однако я продолжаю получать среднюю потерю нан. Я следовал всем указаниям на странице https://github.com/AlexeyAB/darknet.git < / а>. Я отредактировал свой cfg файл со всеми тремя фильтрами для обоих yolo, установленным на 21 (поскольку у меня есть только два класса). Я установил subdivisions на 8 и batch на 64. Я использую чуть более 500 изображений, которые я сделал сам, и я Пытаюсь сделать индивидуальное обнаружение. Я хочу, чтобы йоло определил, является ли изображение большим пальцем вверх или большим пальцем вниз. Я запускал команду поезда много раз, но мне никогда не удавалось пройти 100 итераций и

#config file:
[net]
# Testing
#batch=1
#subdivisions=1
# Training
batch=64
subdivisions=8
width=416
height=416
channels=3
momentum=0.9
decay=0.0005
angle=0
saturation = 1.5
exposure = 1.5
hue=.1

learning_rate=0.001
burn_in=1000
max_batches = 500200
policy=steps
steps=400000,450000
scales=.1,.1

[convolutional]
batch_normalize=1
filters=16
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=32
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=64
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=128
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=256
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

[convolutional]
batch_normalize=1
filters=512
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=1

[convolutional]
batch_normalize=1
filters=1024
size=3
stride=1
pad=1
activation=leaky

###########

[convolutional]
batch_normalize=1
filters=21
size=1
stride=1
pad=1
activation=leaky

[convolutional]
batch_normalize=1
filters=21
size=3
stride=1
pad=1
activation=leaky

[convolutional]
size=1
stride=1
pad=1
filters=21
activation=linear



[yolo]
mask = 3,4,5
anchors = 38, 93,  55,120,  66,156,  90,259, 110,239, 118,283
classes=2
num=6
jitter=.3
ignore_thresh = .7
truth_thresh = 1
random=1

[route]
layers = -4

[convolutional]
batch_normalize=1
filters=21
size=1
stride=1
pad=1
activation=leaky

[upsample]
stride=2

[route]
layers = -1, 8

[convolutional]
batch_normalize=1
filters=21
size=3
stride=1
pad=1
activation=leaky

[convolutional]
size=1
stride=1
pad=1
filters=21
activation=linear

[yolo]
mask = 0,1,2
anchors = 38, 93,  55,120,  66,156,  90,259, 110,239, 118,283
classes=2
num=6
jitter=.3
ignore_thresh = .7
truth_thresh = 1
random=1

person Rice Man    schedule 18.03.2019    source источник
comment
Попробуйте пересчитать ваши якорные боксы для крошечных кластеров yolo 6 darknet.exe detector calc_anchors data/obj.data -num_of_clusters 6 -width 416 -height 416. Затем следуйте руководству Алексея, чтобы внести изменения в свой файл cfg.   -  person gameon67    schedule 19.03.2019
comment
Я пробовал это, но те же результаты, примерно после 45 итераций avg loss = nan   -  person Rice Man    schedule 19.03.2019
comment
А нормальных йолов3 пробовали? Вы можете поделиться своим файлом cfg? При обучении программа выдает список плохих изображений (см. Alexey repo)?   -  person gameon67    schedule 19.03.2019
comment
Я не пробовал yolov3, у меня есть процессор, и, судя по тому, что я читал, он будет работать слишком медленно, поэтому я начал с yolov3-tiny. Я ничего не видел в списке изображений в качестве вывода. Я ожидал получить файл с весами, но в любом случае программа ничего не выводит.   -  person Rice Man    schedule 19.03.2019
comment
Что, если вы дождетесь новых итераций? 100 очень мало   -  person gameon67    schedule 19.03.2019
comment
Он будет идти только примерно до 78 или около того, а затем программа завершится, примерно все значения от 45 до 78 итераций будут nan.   -  person Rice Man    schedule 19.03.2019
comment
Согласен, хотелось бы 20 или 42к, но прога всегда умирает около 79.   -  person Rice Man    schedule 19.03.2019


Ответы (1)


попробуйте: random = 0

у меня работает при тренировке yolov3-tiny ~

person Austin Kuo    schedule 05.12.2019