Ускорение вывода нескольких моделей на EDGE TPU

Переподготовил модель RESNET50 для повторной идентификации на EDGE TPU. Однако, похоже, нет способа получить пакет изображений в EDGE_TPU.

Я придумал решение запускать несколько одинаковых моделей для изображений.

Однако есть ли способ ускорить вывод модели для нескольких моделей? Распределение потоков теперь даже медленнее, чем вывод одной модели


person dtlam26    schedule 14.09.2020    source источник


Ответы (2)


Да, архитектор edgetpu не разрешает обработку в размере партии. Вы пробовали конвейерную обработку моделей? https://coral.ai/docs/edgetpu/pipeline/

К сожалению, сейчас доступно только на C ++, но мы планируем расширить его до Python в середине четвертого квартала.

person Nam Vu    schedule 14.09.2020
comment
Спасибо, Нам. Я попробую, мой вьетнамский парень: D - person dtlam26; 15.09.2020
comment
это за пределами раздела комментариев, но как пост-квантовать полный целочисленный вывод на керас с несколькими выходами. Я пытался и всегда терпел неудачу при компиляции edge_tpu. Вы не могли бы проверить это для меня? Прикрепляю свою модель ниже - person dtlam26; 16.09.2020
comment
drive.google.com/drive/folders/ - person dtlam26; 16.09.2020
comment
@ dtlam26 как выглядит ваш скрипт ptq? Можете ли вы также разместить его в этой папке на диске? - person Nam Vu; 17.09.2020
comment
Я загрузил его, Нам. Спасибо, что уделили мне время - person dtlam26; 18.09.2020
comment
Я намерен получить квантование с вводом и выводом с плавающей запятой для проблемы регрессии - person dtlam26; 18.09.2020

Поскольку пакетный вывод сейчас недоступен, конвейерная обработка является еще одним второстепенным вариантом. Однако, испытав мою модель, мы можем сделать псевдо-пакет, подав несколько одиночных входных данных для EDGE_TPU в качестве другого варианта.

введите описание изображения здесь

person dtlam26    schedule 08.10.2020