Публикации по теме 'computer-vision'


8 ошибок глубокого обучения / компьютерного зрения, и как я мог их избежать
Люди несовершенны, мы часто делаем ошибки в нашем программном обеспечении. Иногда эти ошибки легко найти: ваш код просто не работает, ваше приложение дает сбой и так далее. Но некоторые ошибки скрыты, и это делает их еще более опасными. Работая над проблемами глубокого обучения, можно легко сделать некоторые ошибки этого типа из-за некоторой неопределенности: легко увидеть, правильно ли направляет запрос конечная точка веб-приложения, и не так просто проверить, был ли правильный шаг..

Что такое компьютерное зрение
Что такое компьютерное зрение? Люди используют свои глаза и мозг, чтобы видеть и визуально ощущать окружающий мир. Компьютерное зрение — это наука, цель которой — предоставить машине или компьютеру такие же, если не лучшие, возможности. Компьютерное зрение связано с автоматическим извлечением, анализом и пониманием полезной информации из одного изображения или последовательности изображений. Он включает в себя разработку теоретической и алгоритмической основы для достижения..

Как обучить StyleGAN создавать реалистичные лица
Почему StyleGAN превосходит другие модели для генерации лиц и как тренировать свой собственный StyleGAN Генеративные состязательные сети (GAN) - это архитектура, представленная Яном Гудфеллоу и его коллегами в 2014 году для генеративного моделирования, которая использует модель для создания новых выборок, имитирующих существующий набор данных. Он состоит из двух сетей: генератора , который генерирует новые образцы, и дискриминатора , который обнаруживает поддельные образцы...

Введение в TensorFlow для искусственного интеллекта, машинного обучения и глубокого обучения: часть 3
Улучшение зрения с помощью сверточных нейронных сетей Задача классификации моды. Первоначальное обсуждение посвящено использованию нейронной сети для классификации моды. Задача включает в себя обучение глубокой нейронной сети (DNN) для классификации предметов моды на основе их изображений. Цель состоит в том, чтобы повысить точность классификации путем изучения различных подходов. Сверточные нейронные сети (CNN): CNN представлены как потенциальное решение для улучшения задачи..

Понимание диффузии как повторяющегося смешивания
В этой статье мы стремимся получить более простое представление о диффузии посредством смешивания. Генеративная визуализация на основе диффузии — это класс генеративного моделирования. Знаменитые системы ДаллЭ-2 , Имижен , Стабильная диффузия основаны на этой методике. Пример показан ниже. Фотография, созданная цифровым изображением искусственного интеллекта DALL-E 2. Этот текст был создан с использованием подсказки: «Мишки Тедди работают над новыми..

Видео: введение в компьютерное зрение с обнимающим лицом
Слайды: https://www.slideshare.net/JulienSIMON5/an-introduction-to-computer-vision-with-hugging-face

Мультимодальные методы: визуальное распознавание речи (чтение по губам)
Недавнее пересечение компьютерного зрения и обработки естественного языка (часть первая) Это первая часть нашей последней серии публикаций, в которой рассматриваются некоторые пересечения между компьютерным зрением (CV) и обработкой естественного языка (NLP). Читателям предлагается просмотреть статью на нашем веб-сайте для лучшего восприятия: http://www.themtank.org/multi-modal-methods Часть первая: визуальное распознавание речи (чтение по губам) Часть вторая: подписи к..