Компьютерное зрение, Глубокое обучение

Цифровой художник: Creative Adversarial Networks (CAN)

Интересный подход, позволяющий улучшить искусственный интеллект в искусстве «подделки»!

Искусственный интеллект, несомненно, штурмовал человечество в прошлые годы, машины чрезвычайно хорошо имитируют то, что мы им говорим. Но ИИ и креативность - это противоположности, креативность - это абстрактное понятие, которое все еще отсутствует в основной области ИИ.

В течение последних нескольких лет исследователи пытались расшифровать способность машины имитировать интеллект человеческого уровня для создания творческих продуктов, таких как шутки, стихи, задачи, картины, музыка и т. Д. Неотъемлемой целью является показать, что алгоритмы искусственного интеллекта -достаточно умен, чтобы создавать произведения искусства без привлечения художников-людей, но принимая во внимание творческие продукты человека в процессе обучения.

Для исследования творческого пространства было введено несколько интересных алгоритмов, таких как GANs (G enerative A dversarial N etworks) ». В прошлом году GAN штурмом взяли сферу искусственного интеллекта, создав фальшивые лица, похожие на человеческие. Он реализует неявные методы, то есть обучается без передачи данных в сеть.

GAN составляют две сети: дискриминатор и генератор. Цель генератора - генерировать «фальшивые» изображения, а дискриминатор пытается отсечь «фальшивые» изображения, созданные Генератором, с помощью предоставленных обучающих данных. Генератор генерирует случайные изображения и запрашивает обратную связь дискриминатора, то есть, считает ли дискриминатор реальным или фальшивым. В состоянии самообладания дискриминатор не сможет различать случайно сгенерированные изображения и фактические изображения во время обучения, и цель генератора достигнута. И Генератор, и Дискриминатор не зависят друг от друга, но итеративный процесс помогает Дискриминатору и Генератору постоянно учиться на недостатках друг друга для создания еще более качественных изображений.

Предположим, мы обучаем наш GAN на изображениях картины. Мотив генератора - генерировать изображения из обучающего распределения, чтобы дискриминатор мог пометить их как «настоящие». В конечном итоге генератор начнет имитировать существующее искусство, и дискриминатор сразу же будет обманут, модель генерирует новые изображения, но изображения далеки от того, чтобы называть их новыми или творческими. Таким образом, можно сделать вывод, что способность GAN генерировать творческие идеи в их первоначальном дизайне ограничена.

Секретный ингредиент для разработки алгоритма, способного творчески мыслить, - это увязать творческий процесс с развитием человеческого искусства на протяжении всего времени. Проще говоря, мы пытаемся точно имитировать то, как люди развивают искусство. Люди на протяжении всей своей жизни сталкиваются с различными формами искусства, и именно здесь они получают впечатление от своего нового искусства, это точный рабочий процесс, которому мы хотим, чтобы наша модель следовала.

Опыт и творчество.

Принцип «наименьших усилий»

CAN происходят от GAN и основаны на принципе Мартиндейла, в котором он утверждал, что искусство становится привлекательным за счет увеличения его возбуждающего потенциала, который препятствует его привыканию. Проще говоря, искусство воспринимается зрителями, когда им предлагают что-то эксклюзивное, но связанное с историческими произведениями. Но уровень возбуждения должен контролироваться, а не расти экспоненциально, чтобы вызвать негативную реакцию.

Цель модели - удовлетворить «потенциал возбуждения», который относится к уровням возбуждения у людей. Уровень возбуждения самый низкий, когда человек спит или расслаблен, и самый высокий, когда человек сталкивается с яростью / опасностью / насилием. Таким образом, слишком низкий потенциал возбуждения может быть утомительным, а слишком большой - активировать враждебные ситуации. Ситуацию лучше всего объясняет кривая Вундта.

Кроме того, если художник продолжает создавать подобные работы, это автоматически снижает возбуждающий потенциал и вызывает у зрителя отвращение. Можно сделать вывод, что привыкание создает постоянное давление для создания более высокого уровня возбуждающего потенциала.

Модель пытается усилить возбуждающий потенциал, увеличивая «стилистическую двусмысленность» и по-прежнему избегая отхода слишком далеко от того, что мы принимаем как искусство. Архитектура CAN унаследована от GAN с немного измененным рабочим процессом. Дискриминатор снабжен большим набором произведений искусства, испытанных человечеством, с соответствующими ярлыками стилей, такими как Ренессанс, Барокко, Импрессионизм, Экспрессионизм и т. Д. Генератор не содержит обучающих примеров, подобных GAN. но предназначен для приема двух сигналов от дискриминатора.

Первый сигнал показывает, классифицирует ли дискриминатор сгенерированное изображение как «искусство или нет». В традиционных сетях GAN этот сигнал заставит генератор изменить веса и снова попытаться обмануть дискриминатор, заставив его поверить, что искусство исходит из того же пользовательского распределения. Но в CAN дискриминатор обучается на большом наборе данных об искусстве, он может точно различать сгенерированное изображение как «искусство или не искусство» и только запрашивает преобразование генератора в изображения, которые уже были приняты как «искусство».

Второй сигнал указывает уровень точности дискриминатора для классификации созданного искусства по уже определенным классам. Если генератор может сгенерировать произведение искусства, которое можно рассматривать как «искусство», а также может быть легко выделено дискриминатором в уже определенный класс, то он успешно обманул дискриминатор, сгенерировав некоторое искусство, которое может быть включено в такой класс. назвал людей принятым искусством. Генератор пытается обмануть дискриминатор, заставляя его думать о сгенерированном фрагменте как о «искусстве», а также сбивает его с толку о стилях работы, которые были сгенерированы.

Два сигнала работают противоположно друг другу, первый заставляет генератор генерировать искусство, которое может быть принято как «искусство», и в случае успеха позволяет дискриминатору легко классифицировать изображения. Однако второй сигнал будет существенно наказывать за это генератор, поскольку мотивом было создание неоднозначного стиля искусства, то есть чего-то, что не может быть легко классифицировано дискриминатором, но все же может рассматриваться как «искусство». Оба сигнала работают независимо, но играют важную роль в совершенствовании друг друга, как и в GAN.

Количественная проверка

В приведенной выше таблице зрители попытались оценить четыре набора произведений искусства. DCGAN - это стандартный GAN, который точно имитирует устоявшиеся художественные работы, но ему не хватает креативности. Набор данных Abstract Expresionist - это коллекция произведений искусства, созданных между 1945 и 2007 годами, тогда как Art Basel 2016 представляет собой изображения, представленные на Art Basel 2016, ведущей художественной выставке.

Неудивительно, что изображения, сгенерированные из CAN, имеют наивысший рейтинг по методикам определения потенциала возбуждения, то есть новизне, неожиданности, неоднозначности и сложности. Кроме того, они лучше обманывали зрителей, заставляя их поверить в то, что искусство было создано людьми.

Использованная литература:

Не стесняйтесь подключаться:

Портфолио ~ https://www.dakshtrehan.com

LinkedIn ~ https://www.linkedin.com/in/dakshtrehan

Следите за дальнейшими блогами по машинному обучению / глубокому обучению.

Средний ~ https://medium.com/@dakshtrehan

Хотите узнать больше?

Готовы ли вы поклоняться богам искусственного интеллекта?
Обнаружение COVID-19 с помощью глубокого обучения
Неизбежный алгоритм искусственного интеллекта: TikTok
GPT-3: началось подавление ИИ? < br /> Tinder + AI: идеальный подбор игроков?
Инсайдерское руководство по карикатуре с использованием машинного обучения
Укрепление науки за обучением с подкреплением
Расшифровка науки за генеративными состязательными сетями
Понимание LSTM и GRU
Рекуррентная нейронная сеть для чайников
Сверточная нейронная сеть для чайников

Ваше здоровье