Многолучевость:

В Multipath мы фокусируемся на проблеме прогнозирования будущих состояний агентов, что является важнейшей задачей для планирования роботов в реальных условиях. Мы особенно заинтересованы в решении этой проблемы для беспилотных транспортных средств, приложения с потенциально огромным социальным влиянием. В основном прогнозирование будущего других агентов в этой области жизненно важно для безопасной, комфортной и эффективной работы.

Например, важно знать, следует ли уступить транспортному средству, если оно собирается подрезаться перед нашим роботом, или когда лучше всего добавиться в поток. Такое предсказание будущего требует понимания статического и динамического мирового контекста: семантики дорог (например, связи полос, стоп-линий), информации о светофорах и прошлых наблюдений за другими агентами, как показано на рисунке ниже. Фундаментальный аспект предсказания будущего состояния — что он по своей сути стохастический, поскольку агенты не могут знать мотивы друг друга. Когда мы за рулем, мы никогда не можем быть уверены, что другие водители будут делать дальше, и важно учитывать множественные результаты и их вероятность.

Мы ищем модель будущего, которая может обеспечить:

(i) взвешенный, экономный набор дискретных траекторий, который покрывает пространство вероятных результатов, и (ii) оценка вероятности любой траектории в закрытой форме. Эти два атрибута позволяют эффективно рассуждать в соответствующих вариантах использования планирования, например, человекоподобные реакции на гипотезы дискретной траектории (например, уступка, следование) и вероятностные запросы, такие как ожидаемый риск столкновения в пространственно-временной области. Эта модель решает эти проблемы с критическим пониманием: она использует фиксированный набор якорей траектории в качестве основы нашего моделирования. Это позволяет нам иерархически учитывать стохастическую неопределенность: во-первых, неопределенность намерений отражает неопределенность того, что агент намеревается сделать, и кодируется как распределение по набору траекторий привязки. Во-вторых, при наличии намерения неопределенность контроля представляет нашу неуверенность в том, как они могут этого добиться. Мы предполагаем, что неопределенность управления нормально распределяется на каждом будущем временном шаге [Thrun05], параметризованном таким образом, что среднее значение соответствует контекстно-зависимому смещению от состояния привязки, а связанная с ним ковариация отражает унимодальную алеаторическую неопределенность [Kendall17]. Рис. Иллюстрирует типичный сценарий, в котором есть три возможных намерения с учетом контекста сцены, с уточнением среднего смещения управления с учетом геометрии дороги и неопределенностью управления, интуитивно растущей с течением времени. Наши якоря траектории — это режимы, найденные в наших обучающих данных в пространстве последовательности состояний посредством неконтролируемого обучения. Эти якоря предоставляют шаблоны для грубой детализации фьючерсов для агента и могут соответствовать семантическим понятиям, таким как «сменить полосу движения» или «притормозить» (хотя, чтобы было ясно, мы не используем никаких семантических понятий в нашем моделировании).

Наша полная модель предсказывает смешанную модель Гаусса (GMM) на каждом временном шаге с фиксированными во времени весами смеси (распределение намерений). Имея такую ​​модель параметрического распределения, мы можем напрямую оценить вероятность любой будущей траектории и иметь простой способ получить компактный, разнообразный взвешенный набор выборок траекторий: выборку MAP из каждого якорного намерения.