В предыдущей инсталляции этой серии, «Мир автономных транспортных средств», мы исследовали уровни автономии, датчики, управляющие приложениями для автономных транспортных средств, и текущий рынок. В этой итерации мы углубимся в алгоритмы машинного обучения, используемые для развертывания автономных транспортных средств, а также в то, как данные преобразуются и объединяются для подачи на бортовые системы восприятия.

Информация является необходимым топливом для управления автономными транспортными средствами (AV). С несколькими датчиками, непрерывно поступающими на бортовой компьютер, данные могут быстро поглощать память и тормозить процесс принятия решений. По словам бывшего генерального директора Intel Брэйна Кржанича, беспилотные автомобили будут генерировать и потреблять около 40 терабайт данных за каждые восемь часов вождения. По сути, AV потребляют данные с беспрецедентной скоростью, но с таким количеством информации, как AV может быстро потреблять столько данных и превращать их в точные измерения своей среды, которые дополняют машинное обучение в AV? Объединяя массивы данных, генерируемых датчиками, система может передавать репрезентативную модель окружающей среды в алгоритмы обнаружения объектов, идентификации объектов и принятия решений, которые будут приводить в действие механику AV.

В приложении AV данных не мало. С лидаром, обеспечивающим 45 гигабайт данных, стереокамерой, генерирующей 2 терабайта в час, и одним радарным датчиком, генерирующим 360 мегабайт данных каждый час, отдельный AV голоден как никогда. Кроме того, все датчики не созданы одинаковыми, и у них могут быть разные сильные и слабые стороны.

В то время как радар может отслеживать приближающийся объект со скоростью 12 м/с, камера может отслеживать объект со скоростью 10 м/с. Чтобы создать надежную и надежную модель окружающей среды, AV полагаются на слияние датчиков, чтобы уменьшить шум датчиков в данных и создать точную модель окружающей среды вокруг них. Наиболее распространенным алгоритмом объединения датчиков является фильтр Калмана. Фильтр Калмана работает в три этапа:

  1. Прогнозы. Используя кинематические уравнения и предыдущие измерения позиционирования, система прогнозирует, где будет находиться транспортное средство, и его скорость в следующую единицу времени. Опираясь на матричные операции, система способна оптимизировать вычислительную мощность.
  2. Измерения. На этом этапе фактически используется фильтр. Когда датчики получают измерения транспортного средства в реальном времени, фильтр объединяет и сравнивает измерения с самыми последними прогнозами. Затем фильтр использует модель Гаусса для определения конечного состояния транспортного средства, и выбирается значение датчика с наименьшей неопределенностью.
  3. Обновление. Наконец, окончательное состояние автомобиля обновляется значениями, сгенерированными на предыдущем шаге. Хотя значения, вычисленные ранее, не полностью заменяют измерения состояния транспортного средства, они добавляются таким образом, что модель больше склоняется к прогнозируемому значению.

Благодаря отфильтрованным данным алгоритмы принятия решений получают лучшее представление об окружающей среде.

Машинное обучение (ML) является основой любого AV-приложения. Используя предопределенный набор правил обучения, алгоритмы намного более устойчивы к масштабированию. Кроме того, опора на обучающие данные делает алгоритмы гораздо более подготовленными к адаптации к новым условиям без предположения о детерминированности мира. В истинном смысле автономии машинное обучение может развиваться без вмешательства человека. Конечно, перед машинным обучением в антивирусных приложениях стоит очень сложная задача. От распознавания знака «Стоп» до принятия решений за доли секунды, которые могут защитить пассажиров внутри, воспроизведение и автоматизация задач вождения, обычно предназначенных для людей, — непростая миссия. На уровне земли AV должны иметь возможность обнаруживать и классифицировать объекты на своем пути с очень высокой точностью. Если ML интерпретирует знак остановки как зеленый сигнал, последствия могут быть ужасными. Как правило, большинство антивирусных приложений используют усовершенствованные системы помощи водителю (ADAS) для классификации объектов в своей среде.

ADAS больше опирается на данные изображения, собирая и обрабатывая снимки окружающей среды для обнаружения объектов, дорожных знаков, пешеходов, полос движения и потенциальных столкновений. Обычно компьютерное зрение в AV использует размытие по Гауссу и фильтры Канни для извлечения краев из изображения (см. пример ниже). С четко очерченными краями компьютер может отличить границы трехмерного объекта от двумерного ввода, а шум данных, который может возникнуть из-за текстур в окружающей среде, опускается. Исходя из этих границ, компьютерное зрение может укладывать сегменты линий по краям и лучше классифицировать объект. Наконец, сегменты линий анализируются, и для распознавания шаблонов используются такие алгоритмы, как машины опорных векторов (SVM), гистограммы ориентированных градиентов (HOG) и анализ основных компонентов (PCA), K-ближайшие соседи (KNN) и правило принятия решений Байеса. в установленных границах.

Исходное изображение в градациях серого без цветовых каналов

Изображение с фильтром Canny

Кроме того, требования высокой скорости движения могут искажать данные, полученные от датчиков, поэтому важно, чтобы в случае изображений низкого качества машинное обучение все еще могло обнаруживать и определять местоположение объектов. Антивирусы эффективно используют алгоритмы кластеризации для восстановления ошибочных данных. Подобно ADAS, эти алгоритмы кластеризации работают для классификации объектов в среде AV. Учитывая несоответствия в данных, такие алгоритмы, как K-Means и Multi-class Neural Networks, используют центроидные и иерархические методы обучения для выявления неясных структур. Как упоминалось ранее, классификация является одним из наиболее важных шагов в автономном вождении, и эти алгоритмы действуют как избыточность, поддерживающая компьютерное зрение.

Более того, ML должен принимать решения. С прогнозами вышеупомянутых алгоритмов машинному обучению необходимо решить, когда и на сколько поворачивать, а также когда ускоряться и замедляться. Эти алгоритмы имеют решающее значение для пилотирования AV, и, исследуя уровни достоверности предыдущих прогнозов, AV может обеспечить направленную уверенность в окружающей среде и исследовать взаимосвязи между прогнозами. Используя Gradient Boosting (GDM) и AdaBoosting, AV может комбинировать все модели принятия решений, чтобы делать прогнозы с низкой частотой ошибок. Как правило, повышающие алгоритмы объединяют несколько моделей с более низкой точностью вместе, чтобы создать единственное сильное правило обучения. На каждом этапе генерации слабой модели алгоритмы повышения ранжируют каждую модель и выявляют ложные прогнозы. С каждой эпохой сингулярная модель обновляется, и со временем модель становится более точной.

Jaguar Land Rover прогнозирует, что приложения AV уровня 5 будут реализовывать примерно один миллиард строк кода, и по мере постоянного улучшения алгоритмов ML, AV станут более реальными. В то время как большинство AV-приложений все еще находятся на стадии разработки, опора поколений на AI и ML будет стимулировать эти приложения.

По мере того, как датчики совершенствуются, чтобы лучше снабжать бортовые системы и алгоритмы срабатывания, качество и количество генерируемых данных будут только расти. Однако из-за того, что один AV генерирует терабайты данных каждый час, компании сталкиваются с проблемой сбора и хранения всех данных от каждого AV. Создание парка подключенных беспилотных летательных аппаратов значительно увеличивает объем данных, которыми необходимо управлять, а с приходом на рынок беспилотных летательных аппаратов ожидаемый объем данных пугает. Но, объединив все данные AV в единый домен, компании могут расширить диапазон своего анализа дорог и разнообразить производительность в любых условиях.

В более крупном масштабе приложения AV требуют надежного промежуточного программного обеспечения, способного эффективно справляться с огромными требованиями к хранению и обработке с высокой пропускной способностью. Обладая способностью обрабатывать миллионы тем публикации/подписки с нулевой потерей сообщений и высокой пропускной способностью, Pandio может эффективно создавать архитектуру, способную удовлетворить требования машинного обучения любого приложения AV. Кроме того, разделяя домены хранения и вычислений, Pandio может ускорить преобразование данных в информативные показатели. Чтобы узнать больше о Pandio как о решении для управления данными ИИ, посетите нашу страницу продукта!

В заключительной части этой статьи мы рассмотрим традиционные архитектуры управления данными и потребность в распределенных платформах обмена сообщениями в AV-пространстве в качестве решения для создания парка подключенных транспортных средств.