В предыдущей инсталляции этой серии, «Мир автономных транспортных средств», мы исследовали уровни автономии, датчики, управляющие приложениями для автономных транспортных средств, и текущий рынок. В этой итерации мы углубимся в алгоритмы машинного обучения, используемые для развертывания автономных транспортных средств, а также в то, как данные преобразуются и объединяются для подачи на бортовые системы восприятия.
Информация является необходимым топливом для управления автономными транспортными средствами (AV). С несколькими датчиками, непрерывно поступающими на бортовой компьютер, данные могут быстро поглощать память и тормозить процесс принятия решений. По словам бывшего генерального директора Intel Брэйна Кржанича, беспилотные автомобили будут генерировать и потреблять около 40 терабайт данных за каждые восемь часов вождения. По сути, AV потребляют данные с беспрецедентной скоростью, но с таким количеством информации, как AV может быстро потреблять столько данных и превращать их в точные измерения своей среды, которые дополняют машинное обучение в AV? Объединяя массивы данных, генерируемых датчиками, система может передавать репрезентативную модель окружающей среды в алгоритмы обнаружения объектов, идентификации объектов и принятия решений, которые будут приводить в действие механику AV.
В приложении AV данных не мало. С лидаром, обеспечивающим 45 гигабайт данных, стереокамерой, генерирующей 2 терабайта в час, и одним радарным датчиком, генерирующим 360 мегабайт данных каждый час, отдельный AV голоден как никогда. Кроме того, все датчики не созданы одинаковыми, и у них могут быть разные сильные и слабые стороны.
В то время как радар может отслеживать приближающийся объект со скоростью 12 м/с, камера может отслеживать объект со скоростью 10 м/с. Чтобы создать надежную и надежную модель окружающей среды, AV полагаются на слияние датчиков, чтобы уменьшить шум датчиков в данных и создать точную модель окружающей среды вокруг них. Наиболее распространенным алгоритмом объединения датчиков является фильтр Калмана. Фильтр Калмана работает в три этапа:
- Прогнозы. Используя кинематические уравнения и предыдущие измерения позиционирования, система прогнозирует, где будет находиться транспортное средство, и его скорость в следующую единицу времени. Опираясь на матричные операции, система способна оптимизировать вычислительную мощность.
- Измерения. На этом этапе фактически используется фильтр. Когда датчики получают измерения транспортного средства в реальном времени, фильтр объединяет и сравнивает измерения с самыми последними прогнозами. Затем фильтр использует модель Гаусса для определения конечного состояния транспортного средства, и выбирается значение датчика с наименьшей неопределенностью.
- Обновление. Наконец, окончательное состояние автомобиля обновляется значениями, сгенерированными на предыдущем шаге. Хотя значения, вычисленные ранее, не полностью заменяют измерения состояния транспортного средства, они добавляются таким образом, что модель больше склоняется к прогнозируемому значению.
Благодаря отфильтрованным данным алгоритмы принятия решений получают лучшее представление об окружающей среде.
Машинное обучение (ML) является основой любого AV-приложения. Используя предопределенный набор правил обучения, алгоритмы намного более устойчивы к масштабированию. Кроме того, опора на обучающие данные делает алгоритмы гораздо более подготовленными к адаптации к новым условиям без предположения о детерминированности мира. В истинном смысле автономии машинное обучение может развиваться без вмешательства человека. Конечно, перед машинным обучением в антивирусных приложениях стоит очень сложная задача. От распознавания знака «Стоп» до принятия решений за доли секунды, которые могут защитить пассажиров внутри, воспроизведение и автоматизация задач вождения, обычно предназначенных для людей, — непростая миссия. На уровне земли AV должны иметь возможность обнаруживать и классифицировать объекты на своем пути с очень высокой точностью. Если ML интерпретирует знак остановки как зеленый сигнал, последствия могут быть ужасными. Как правило, большинство антивирусных приложений используют усовершенствованные системы помощи водителю (ADAS) для классификации объектов в своей среде.
ADAS больше опирается на данные изображения, собирая и обрабатывая снимки окружающей среды для обнаружения объектов, дорожных знаков, пешеходов, полос движения и потенциальных столкновений. Обычно компьютерное зрение в AV использует размытие по Гауссу и фильтры Канни для извлечения краев из изображения (см. пример ниже). С четко очерченными краями компьютер может отличить границы трехмерного объекта от двумерного ввода, а шум данных, который может возникнуть из-за текстур в окружающей среде, опускается. Исходя из этих границ, компьютерное зрение может укладывать сегменты линий по краям и лучше классифицировать объект. Наконец, сегменты линий анализируются, и для распознавания шаблонов используются такие алгоритмы, как машины опорных векторов (SVM), гистограммы ориентированных градиентов (HOG) и анализ основных компонентов (PCA), K-ближайшие соседи (KNN) и правило принятия решений Байеса. в установленных границах.
Исходное изображение в градациях серого без цветовых каналов
Изображение с фильтром Canny
Кроме того, требования высокой скорости движения могут искажать данные, полученные от датчиков, поэтому важно, чтобы в случае изображений низкого качества машинное обучение все еще могло обнаруживать и определять местоположение объектов. Антивирусы эффективно используют алгоритмы кластеризации для восстановления ошибочных данных. Подобно ADAS, эти алгоритмы кластеризации работают для классификации объектов в среде AV. Учитывая несоответствия в данных, такие алгоритмы, как K-Means и Multi-class Neural Networks, используют центроидные и иерархические методы обучения для выявления неясных структур. Как упоминалось ранее, классификация является одним из наиболее важных шагов в автономном вождении, и эти алгоритмы действуют как избыточность, поддерживающая компьютерное зрение.
Более того, ML должен принимать решения. С прогнозами вышеупомянутых алгоритмов машинному обучению необходимо решить, когда и на сколько поворачивать, а также когда ускоряться и замедляться. Эти алгоритмы имеют решающее значение для пилотирования AV, и, исследуя уровни достоверности предыдущих прогнозов, AV может обеспечить направленную уверенность в окружающей среде и исследовать взаимосвязи между прогнозами. Используя Gradient Boosting (GDM) и AdaBoosting, AV может комбинировать все модели принятия решений, чтобы делать прогнозы с низкой частотой ошибок. Как правило, повышающие алгоритмы объединяют несколько моделей с более низкой точностью вместе, чтобы создать единственное сильное правило обучения. На каждом этапе генерации слабой модели алгоритмы повышения ранжируют каждую модель и выявляют ложные прогнозы. С каждой эпохой сингулярная модель обновляется, и со временем модель становится более точной.
Jaguar Land Rover прогнозирует, что приложения AV уровня 5 будут реализовывать примерно один миллиард строк кода, и по мере постоянного улучшения алгоритмов ML, AV станут более реальными. В то время как большинство AV-приложений все еще находятся на стадии разработки, опора поколений на AI и ML будет стимулировать эти приложения.
По мере того, как датчики совершенствуются, чтобы лучше снабжать бортовые системы и алгоритмы срабатывания, качество и количество генерируемых данных будут только расти. Однако из-за того, что один AV генерирует терабайты данных каждый час, компании сталкиваются с проблемой сбора и хранения всех данных от каждого AV. Создание парка подключенных беспилотных летательных аппаратов значительно увеличивает объем данных, которыми необходимо управлять, а с приходом на рынок беспилотных летательных аппаратов ожидаемый объем данных пугает. Но, объединив все данные AV в единый домен, компании могут расширить диапазон своего анализа дорог и разнообразить производительность в любых условиях.
В более крупном масштабе приложения AV требуют надежного промежуточного программного обеспечения, способного эффективно справляться с огромными требованиями к хранению и обработке с высокой пропускной способностью. Обладая способностью обрабатывать миллионы тем публикации/подписки с нулевой потерей сообщений и высокой пропускной способностью, Pandio может эффективно создавать архитектуру, способную удовлетворить требования машинного обучения любого приложения AV. Кроме того, разделяя домены хранения и вычислений, Pandio может ускорить преобразование данных в информативные показатели. Чтобы узнать больше о Pandio как о решении для управления данными ИИ, посетите нашу страницу продукта!
В заключительной части этой статьи мы рассмотрим традиционные архитектуры управления данными и потребность в распределенных платформах обмена сообщениями в AV-пространстве в качестве решения для создания парка подключенных транспортных средств.