Публикации по теме 'computer-vision'
8 ошибок глубокого обучения / компьютерного зрения, и как я мог их избежать
Люди несовершенны, мы часто делаем ошибки в нашем программном обеспечении. Иногда эти ошибки легко найти: ваш код просто не работает, ваше приложение дает сбой и так далее. Но некоторые ошибки скрыты, и это делает их еще более опасными.
Работая над проблемами глубокого обучения, можно легко сделать некоторые ошибки этого типа из-за некоторой неопределенности: легко увидеть, правильно ли направляет запрос конечная точка веб-приложения, и не так просто проверить, был ли правильный шаг..
Что такое компьютерное зрение
Что такое компьютерное зрение?
Люди используют свои глаза и мозг, чтобы видеть и визуально ощущать окружающий мир. Компьютерное зрение — это наука, цель которой — предоставить машине или компьютеру такие же, если не лучшие, возможности.
Компьютерное зрение связано с автоматическим извлечением, анализом и пониманием полезной информации из одного изображения или последовательности изображений. Он включает в себя разработку теоретической и алгоритмической основы для достижения..
Как обучить StyleGAN создавать реалистичные лица
Почему StyleGAN превосходит другие модели для генерации лиц и как тренировать свой собственный StyleGAN
Генеративные состязательные сети (GAN) - это архитектура, представленная Яном Гудфеллоу и его коллегами в 2014 году для генеративного моделирования, которая использует модель для создания новых выборок, имитирующих существующий набор данных. Он состоит из двух сетей: генератора , который генерирует новые образцы, и дискриминатора , который обнаруживает поддельные образцы...
Введение в TensorFlow для искусственного интеллекта, машинного обучения и глубокого обучения: часть 3
Улучшение зрения с помощью сверточных нейронных сетей
Задача классификации моды. Первоначальное обсуждение посвящено использованию нейронной сети для классификации моды. Задача включает в себя обучение глубокой нейронной сети (DNN) для классификации предметов моды на основе их изображений. Цель состоит в том, чтобы повысить точность классификации путем изучения различных подходов. Сверточные нейронные сети (CNN): CNN представлены как потенциальное решение для улучшения задачи..
Понимание диффузии как повторяющегося смешивания
В этой статье мы стремимся получить более простое представление о диффузии посредством смешивания.
Генеративная визуализация на основе диффузии — это класс генеративного моделирования. Знаменитые системы ДаллЭ-2 , Имижен , Стабильная диффузия основаны на этой методике. Пример показан ниже.
Фотография, созданная цифровым изображением искусственного интеллекта DALL-E 2. Этот текст был создан с использованием подсказки: «Мишки Тедди работают над новыми..
Видео: введение в компьютерное зрение с обнимающим лицом
Слайды: https://www.slideshare.net/JulienSIMON5/an-introduction-to-computer-vision-with-hugging-face
Мультимодальные методы: визуальное распознавание речи (чтение по губам)
Недавнее пересечение компьютерного зрения и обработки естественного языка (часть первая)
Это первая часть нашей последней серии публикаций, в которой рассматриваются некоторые пересечения между компьютерным зрением (CV) и обработкой естественного языка (NLP). Читателям предлагается просмотреть статью на нашем веб-сайте для лучшего восприятия: http://www.themtank.org/multi-modal-methods
Часть первая: визуальное распознавание речи (чтение по губам)
Часть вторая: подписи к..