Предстоящий Новый Свет

Как компьютеры могут понять визуальный мир людей? Что ж, это основной вопрос нашей темы. Однако есть проблема, которую следует прояснить сначала; «Как новорожденные могут понять визуальный мир человека?». Ответ на этот вопрос проливает свет на путь обучения машины обучению.

Видение - это удивительный подвиг естественного интеллекта. Зрительная кора занимает около 50% мозга макаки, ​​что означает больше человеческого мозга, самого мощного из когда-либо созданных механизмов визуального интеллекта, посвященных зрению, чем чему-либо другому.

- Почему компьютеры должны понимать визуальный мир людей? Почему так важно компьютерное зрение?

Компьютерное зрение имеет заметные преимущества в шести основных областях: безопасность, защищенность, комфорт, здоровье, доступ и развлечения. Есть некоторые основы компьютерного зрения, которые могут принести пользу в этих и других областях:

  • Создание изображения
  • Камеры, Глаза, Калибровка
  • Особенности, переписка
  • 3D видение
  • Оптический поток
  • Отслеживание
  • Сжатие, видение доставки контента

На самом деле компьютерное зрение возникло не недавно, у него смехотворно короткая история, которая началась в 1966 году (Мински относит компьютерное зрение к летнему проекту для студентов):

  • 1960-е: интерпретация синтетических миров
  • 1970-е: некоторый прогресс в интерпретации избранных изображений
  • 1980-е: ИНС приходят и уходят; переход к геометрии и повышенной математической строгости
  • 1990-е: распознавание лиц; статистический анализ в моде
  • 2000-е годы: более широкое признание; доступны большие аннотированные наборы данных; обработка видео начинается
  • 2010-е годы: беспилотные автомобили на дорогах, роботизированные технологии и технологии виртуальной реальности значительно усовершенствованы. Средства компьютерного зрения начали занимать важное место в повседневной жизни.

По словам Фей-Фей Ли, цель - компьютеры, которые не только распознают, но и понимают визуальный контент. Чтобы обеспечить это, люди должны создать базу данных руководящих принципов, потому что нет википедии изображений, лиц, взаимосвязей и движений объектов.

Я верю, что однажды все мечты компьютерных ученых сбудутся. Вопрос в том, «Станем ли мы одной из архитекторов грядущего нового мира?».

Ссылки:

Изображения (упорядоченные):