Обучение GAN с использованием набора данных Galaxy Zoo, TensorFlow и Keras

Как правильно импортировать набор данных Galaxy Zoo? чтобы обучить простой GAN с помощью TensorFlow и Keras? Есть ли такой же простой способ, как, например, импорт MNIST?

from keras.datasets import mnist

person web_tracer    schedule 19.11.2020    source источник


Ответы (1)


Для него нет простого импорта, поскольку это не keras набор данных.

Вам нужно будет загрузить данные и предварительно обработать их перед подачей в сеть. Если вы перейдете по ссылке kaggle и перейдете в записные книжки, вы увидите, как другие люди предварительно обработали свои данные для обучения.

Неважно, на чем вы хотите тренироваться и что вы классифицируете. Если вы хотите потренироваться на изображениях, чтобы классифицировать все или некоторые классы в CSV, вам понадобятся ваши данные в виде изображений и классификации в виде меток. Если вы хотите использовать некоторую классификацию для прогнозирования другой классификации, некоторые классы будут данными, а другие - меткой, которую вы прогнозируете.

Я рекомендую импортировать обучающий csv в фрейм данных pandas

import pandas as pd
df = pd.read_csv('../input/44352/training_solutions_rev1.csv')

Затем вам нужно будет создать собственный генератор для ваших изображений, поскольку они не организованы по классам в структуре папок.

person theastronomist    schedule 19.11.2020
comment
Спасибо! Ситуация прояснилась. Что касается предварительной обработки данных, я тоже так предположил, просто нужно было прояснить это. Я хочу обучить свой GAN генерировать сфабрикованные изображения галактик. Модель и сценарий отлично работают с MNIST и CIFAR-10, и в настоящее время я пытаюсь настроить их для Galaxy Zoo. - person web_tracer; 19.11.2020
comment
Возможно, вам придется изменить размер изображений в соответствии с вашим вводом, galaxyZoo имеет размер 424x424, а также нормализовать немного иначе, чем CIFAR и MNIST. - person theastronomist; 20.11.2020