Как передискретизировать набор данных изображений с помощью Python?

Я работаю над проблемой классификации нескольких классов с несбалансированным набором данных изображений (другой класс). Я пробовал imblearn библиотеку, но она не работает с набором данных изображения.

У меня есть набор данных изображений, принадлежащих к 3 классу, а именно A, B, C. A имеет 1000 данных, B - 300, а C - 100. Я хочу передискретизировать классы B и C, чтобы избежать дисбаланса данных. Пожалуйста, дайте мне знать, как передискретизировать набор данных изображения с помощью python.


person ReInvent_IO    schedule 30.01.2018    source источник
comment
Добро пожаловать в StackOverflow. Пожалуйста, прочтите и следуйте инструкциям по публикации в справочной документации. по теме и как чтобы спросить, подайте заявку здесь. В частности, подробно опишите, что вы пытались сделать (я пробовал, что библиотека imblearn слишком общая) и что не так (она не работает, это не проблема). Мы не можем решить проблему, если не знаем, что вам нужно сделать, что вы сделали и что пошло не так. Здесь применяется минимальный, полный, проверяемый пример.   -  person Prune    schedule 31.01.2018
comment
Спасибо @Prune за то, что сообщили мне правила. Не могли бы вы сообщить мне, как сделать передискретизацию данных с изображениями. У меня есть набор данных изображений, принадлежащих к 3 классу, а именно A, B, C. A имеет 1000 данных, B - 300, а C - 100. Я хочу передискретизировать классы B и C. Чтобы избежать дисбаланса данных. Пожалуйста, дай мне знать. Еще раз спасибо за попытку мне помочь.   -  person ReInvent_IO    schedule 31.01.2018


Ответы (1)


Спасибо за разъяснения. В общем, вы не передискретизируете с помощью Python. Скорее, вы предварительно обрабатываете свою базу данных, дублируя короткие классы. В случае, который вы цитируете, вы можете продублировать все в классе B и сделать 5 копий всего в классе C. Это дает вам новый баланс 1000: 600: 500, что, вероятно, более приемлемо для ваших тренировок. Вместо исходных 1400 изображений теперь вы перетасовываете 2100.

Решает ли это вашу проблему?

person Prune    schedule 31.01.2018