Дипфейки и мир генеративных состязательных сетей

GAN, сокращение от Generative Adversarial Networks, были представлены в статье Иэна Гудфеллоу и других исследователей из Монреальского университета, в том числе Йошуа Бенжио, в 2014 году: Мы предлагаем новую структуру для оценки генеративных моделей с помощью состязательного процесса , в которой мы одновременно обучаем две модели: генеративную модель G, которая фиксирует распределение данных, и дискриминативную модель D, которая оценивает вероятность того, что выборка была получена из обучающих данных, а не G. Процедура обучения для G заключается в максимальном увеличении вероятности из D делает ошибку. Эта структура соответствует минимаксной игре для двух игроков.

MIT IBM Watson AI Lab выпустила демонстрацию Gan Paint, которая дает хорошее представление о том, как работает технология GAN.

GAN можно использовать для множества интересных вещей, но что поразило общественное воображение, так это использование GAN для создания deepFakes, то есть для создания видеороликов с говорящими людьми, в которых лицо было заменено на кого-то другого. Например, видео Барака Обамы выше.

Пространство deepFake состоит из множества облачных веб-страниц, таких как https://deepfakesweb.com и китайское приложение Zao, которые позволяют любому человеку с минимальным знанием Интернета создавать deepFake и размещать их в облаке.

Таким образом, GAN можно использовать для создания deepFake. Но deepFakes - это лишь небольшая часть истории GAN.

GAN можно использовать для создания фотографий воображаемых фотомоделей, без необходимости нанимать настоящую модель, фотографа, визажиста или платить за студию и транспорт.

Создавайте модные образы с помощью генеративных состязательных сетей. Определите модель GAN и внедрите модель DCGAN для создания имиджа моды без написания единой строчки кода . Эта статья IBM, написанная Смрути Раджем Моханом, Раунаком Синха, Ануш Шанкаран и Сентилом Мани, описывает шаблон кода, который состоит из простой JSON, который представляет модель генерирующей состязательной сети (GAN), которая реализует модель Deep Convolutional GAN (DCGAN) для генерации модных изображений без написания единой строчки кода.

И набор данных, который делает это возможным в индустрии моды,

Fashion MNIST
Набор данных в стиле MNIST из 70 000 изображений модной одежды с меткой 28x28 www.kaggle.com

Fashion-MNIST, набор изображений статей Zalando, состоящий из обучающего набора из 60 000 примеров и тестового набора из 10 000 примеров. Каждый пример представляет собой изображение в оттенках серого 28x28, связанное с меткой из 10 классов.

Это пример законного использования моделей GAN, которое может быть весьма драматичным, заменяя людей во всем промышленном сегменте.

GAN также можно использовать для создания искусственных медицинских изображений в целях тестирования, таких как Создание МРТ-изображений опухолей головного мозга с помощью GAN, которое Алисия Каинт описала в Medium и GAN для создания искусственных медицинских изображений, описанных Эдвином Донелли в Twitter.

Использование GAN для медицинской визуализации - это быстрорастущая область в первую очередь из-за существования больших наборов данных.

Обратите внимание на разницу между GAN и DCGAN, глубокими сверточными генерирующими состязательными сетями.

Итак, мы видим, как приложения на основе GAN зависят от ряда факторов. Прежде всего, базовая технология нейронных сетей, затем большие наборы данных, а затем, в случае deepFakes, простые в использовании клиентские инструменты в сети, которые позволяют любому, у кого есть ноутбук, быстро создавать deepFakes.

Очень интересная и в то же время хлопотная технология.

Дипфейки и мир генеративных состязательных сетей

Вопросы по теме