Предстоящий Новый Свет
Как компьютеры могут понять визуальный мир людей? Что ж, это основной вопрос нашей темы. Однако есть проблема, которую следует прояснить сначала; «Как новорожденные могут понять визуальный мир человека?». Ответ на этот вопрос проливает свет на путь обучения машины обучению.
Видение - это удивительный подвиг естественного интеллекта. Зрительная кора занимает около 50% мозга макаки, что означает больше человеческого мозга, самого мощного из когда-либо созданных механизмов визуального интеллекта, посвященных зрению, чем чему-либо другому.
- Почему компьютеры должны понимать визуальный мир людей? Почему так важно компьютерное зрение?
Компьютерное зрение имеет заметные преимущества в шести основных областях: безопасность, защищенность, комфорт, здоровье, доступ и развлечения. Есть некоторые основы компьютерного зрения, которые могут принести пользу в этих и других областях:
- Создание изображения
- Камеры, Глаза, Калибровка
- Особенности, переписка
- 3D видение
- Оптический поток
- Отслеживание
- Сжатие, видение доставки контента
На самом деле компьютерное зрение возникло не недавно, у него смехотворно короткая история, которая началась в 1966 году (Мински относит компьютерное зрение к летнему проекту для студентов):
- 1960-е: интерпретация синтетических миров
- 1970-е: некоторый прогресс в интерпретации избранных изображений
- 1980-е: ИНС приходят и уходят; переход к геометрии и повышенной математической строгости
- 1990-е: распознавание лиц; статистический анализ в моде
- 2000-е годы: более широкое признание; доступны большие аннотированные наборы данных; обработка видео начинается
- 2010-е годы: беспилотные автомобили на дорогах, роботизированные технологии и технологии виртуальной реальности значительно усовершенствованы. Средства компьютерного зрения начали занимать важное место в повседневной жизни.
По словам Фей-Фей Ли, цель - компьютеры, которые не только распознают, но и понимают визуальный контент. Чтобы обеспечить это, люди должны создать базу данных руководящих принципов, потому что нет википедии изображений, лиц, взаимосвязей и движений объектов.
Я верю, что однажды все мечты компьютерных ученых сбудутся. Вопрос в том, «Станем ли мы одной из архитекторов грядущего нового мира?».
Ссылки:
- Компьютерное зрение: алгоритмы и приложения, Ричард Селиски
- Http://engineering.stanford.edu/research-profile/fei-fei-li-how-do-we-teach-computers-understand-visual-world
Изображения (упорядоченные):