Ускорение вывода нескольких моделей на EDGE TPU

Переподготовил модель RESNET50 для повторной идентификации на EDGE TPU. Однако, похоже, нет способа получить пакет изображений в EDGE_TPU.

Я придумал решение запускать несколько одинаковых моделей для изображений.

Однако есть ли способ ускорить вывод модели для нескольких моделей? Распределение потоков теперь даже медленнее, чем вывод одной модели

dtlam26 14.09.2020 источник

Ответы (2)

arrow_upward
1
arrow_downward

Да, архитектор edgetpu не разрешает обработку в размере партии. Вы пробовали конвейерную обработку моделей? https://coral.ai/docs/edgetpu/pipeline/

К сожалению, сейчас доступно только на C ++, но мы планируем расширить его до Python в середине четвертого квартала.

Nam Vu 14.09.2020

comment

Спасибо, Нам. Я попробую, мой вьетнамский парень: D - dtlam26; 15.09.2020

comment

это за пределами раздела комментариев, но как пост-квантовать полный целочисленный вывод на керас с несколькими выходами. Я пытался и всегда терпел неудачу при компиляции edge_tpu. Вы не могли бы проверить это для меня? Прикрепляю свою модель ниже - dtlam26; 16.09.2020

comment

drive.google.com/drive/folders/ - dtlam26; 16.09.2020

comment

@ dtlam26 как выглядит ваш скрипт ptq? Можете ли вы также разместить его в этой папке на диске? - Nam Vu; 17.09.2020

comment

Я загрузил его, Нам. Спасибо, что уделили мне время - dtlam26; 18.09.2020

comment

Я намерен получить квантование с вводом и выводом с плавающей запятой для проблемы регрессии - dtlam26; 18.09.2020

arrow_upward
0
arrow_downward

Поскольку пакетный вывод сейчас недоступен, конвейерная обработка является еще одним второстепенным вариантом. Однако, испытав мою модель, мы можем сделать псевдо-пакет, подав несколько одиночных входных данных для EDGE_TPU в качестве другого варианта.

dtlam26 08.10.2020

Ускорение вывода нескольких моделей на EDGE TPU

Ответы (2)

Вопросы по теме