Основанная в 1999 году токийская компания DeNA разработала популярные платформы и сервисы для игр, электронной коммерции, автомобилестроения, здравоохранения и распространения развлекательного контента. Поскольку ИИ продолжает преобразовывать все, что связано с цифровыми технологиями, DeNA расширяет свои технические возможности глубокого обучения для поддержки исследований и разработок в области новых технологий.

Автоматическая генерация персонажей на основе искусственного интеллекта - это экономичное и экономичное решение для производителей видеоигр и аниме. Это также может дать вам творческое вдохновение. Хотя уже были исследованы различные методы создания изображения лица, процессы создания полноразмерных аниме-персонажей до сих пор недостаточно исследованы. Разрешение и качество существующих продуктов относительно низки и не соответствуют высоким стандартам, предъявляемым к производству аниме.

Чтобы решить эти проблемы, DeNA предложила Генеративную состязательную сеть с прогрессивной структурой (PSGAN): алгоритм искусственного интеллекта, адаптированный к созданию поз и костюмов аниме-персонажей. Предыдущее исследование DeNA в этой области позволило получить изображения с разрешением 512 x 512 пикселей. Обновленный метод улучшает вывод изображения до 1024 x 1024 пикселей.

Архитектура каркаса основана на прогрессивном росте сетей GAN NVDIA, усиленном применением многомасштабных структурных условий. Начиная с изображений с низким разрешением, модель сначала изучает крупномасштабную структуру распределения изображений, а затем переключается на мелкие детали с постепенным увеличением как генератора, так и дискриминатора. Это обеспечивает стабильную и быструю тренировку и создание впечатляющих изображений с высоким разрешением. Исследователи DeNA также добавили новые многомерные карты поз с соответствующим разрешением для каждого слоя, что значительно улучшило стабилизацию тренировки .

Набор обучающих данных Avatar Anime-Character содержит 47400 изображений с устранением фона для 69 различных костюмов и 600 поз в большом разнообразии. Каждая поза построена с точными координатами для 20 ключевых точек.

Генерация аниме всего тела включает в себя интерполяцию скрытых переменных для создания костюмов для персонажа аниме, а затем добавление позы или действия персонажу. Повторение этих двух шагов приводит к появлению по-разному одетых и динамичных персонажей аниме.

У PSGAN есть преимущество перед другим программным обеспечением для генерации персонажей в полный рост. Он создает более естественные изображения с гораздо более высокой согласованностью структуры, чем Progressive GAN, и генерирует более плавные и четкие изображения, чем сеть Pose Guided Person Generation Network (PG2), предложенная Ma et al. PSGAN также превосходит эти методы по разрешению изображения (1024 x 1024 против 256 x 256).

Документ DeNA Генерация аниме высокого разрешения в полный рост с прогрессивной структурой-условно-генеративными состязательными сетями был представлен на семинаре Европейской конференции по компьютерному зрению (ECCV) 2018 года в Мюнхене в прошлом месяце и теперь доступен на сайте arXiv .

Источник: Синхронизированный Китай

Локализация: Тинтин Цао | Редактор: Майкл Саразен

Подпишитесь на нас в Twitter @Synced_Global, чтобы получать ежедневные новости об ИИ.

Мы знаем, что вы не хотите пропустить ни одной истории. Подпишитесь на наш популярный Synced Global AI Weekly , чтобы получать еженедельные обновления AI.