GAN, сокращение от Generative Adversarial Networks, были представлены в статье Иэна Гудфеллоу и других исследователей из Монреальского университета, в том числе Йошуа Бенжио, в 2014 году: Мы предлагаем новую структуру для оценки генеративных моделей с помощью состязательного процесса , в которой мы одновременно обучаем две модели: генеративную модель G, которая фиксирует распределение данных, и дискриминативную модель D, которая оценивает вероятность того, что выборка была получена из обучающих данных, а не G. Процедура обучения для G заключается в максимальном увеличении вероятности из D делает ошибку. Эта структура соответствует минимаксной игре для двух игроков.

MIT IBM Watson AI Lab выпустила демонстрацию Gan Paint, которая дает хорошее представление о том, как работает технология GAN.

GAN можно использовать для множества интересных вещей, но что поразило общественное воображение, так это использование GAN для создания deepFakes, то есть для создания видеороликов с говорящими людьми, в которых лицо было заменено на кого-то другого. Например, видео Барака Обамы выше.

Пространство deepFake состоит из множества облачных веб-страниц, таких как https://deepfakesweb.com и китайское приложение Zao, которые позволяют любому человеку с минимальным знанием Интернета создавать deepFake и размещать их в облаке.

Таким образом, GAN можно использовать для создания deepFake. Но deepFakes - это лишь небольшая часть истории GAN.

GAN можно использовать для создания фотографий воображаемых фотомоделей, без необходимости нанимать настоящую модель, фотографа, визажиста или платить за студию и транспорт.

Создавайте модные образы с помощью генеративных состязательных сетей. Определите модель GAN и внедрите модель DCGAN для создания имиджа моды без написания единой строчки кода . Эта статья IBM, написанная Смрути Раджем Моханом, Раунаком Синха, Ануш Шанкаран и Сентилом Мани, описывает шаблон кода, который состоит из простой JSON, который представляет модель генерирующей состязательной сети (GAN), которая реализует модель Deep Convolutional GAN ​​(DCGAN) для генерации модных изображений без написания единой строчки кода.

И набор данных, который делает это возможным в индустрии моды,



Fashion-MNIST, набор изображений статей Zalando, состоящий из обучающего набора из 60 000 примеров и тестового набора из 10 000 примеров. Каждый пример представляет собой изображение в оттенках серого 28x28, связанное с меткой из 10 классов.

Это пример законного использования моделей GAN, которое может быть весьма драматичным, заменяя людей во всем промышленном сегменте.

GAN также можно использовать для создания искусственных медицинских изображений в целях тестирования, таких как Создание МРТ-изображений опухолей головного мозга с помощью GAN, которое Алисия Каинт описала в Medium и GAN для создания искусственных медицинских изображений, описанных Эдвином Донелли в Twitter.

Использование GAN для медицинской визуализации - это быстрорастущая область в первую очередь из-за существования больших наборов данных.

Обратите внимание на разницу между GAN и DCGAN, глубокими сверточными генерирующими состязательными сетями.

Итак, мы видим, как приложения на основе GAN зависят от ряда факторов. Прежде всего, базовая технология нейронных сетей, затем большие наборы данных, а затем, в случае deepFakes, простые в использовании клиентские инструменты в сети, которые позволяют любому, у кого есть ноутбук, быстро создавать deepFakes.

Очень интересная и в то же время хлопотная технология.