Я новичок в программировании на GPU. Я прочитал материал, объясняющий основные концепции.
Однако я хочу знать, можно ли назначить набор инструкций или целый алгоритм / двоичный файл конкретному ALU, чтобы я мог быть уверен, что эти инструкции были выполнены только этим ALU (следовательно, в обход системы, которая автоматически позаботится о распараллеливании)?
Я должен «протестировать» отдельные ALU на графическом процессоре на предмет возможных задержек вычислений между ними. Таким образом, я хочу назначить (аналогичный) набор инструкций нескольким конкретным ALU, измерить время, необходимое для выполнения этого набора инструкций, и сравнить результаты, если есть какие-либо различия.
В общем, я хочу проверить графический процессор на наличие определенных источников состояния гонки. Первое, о чем я подумал, - это потенциальная мизерная разница в скорости выполнения разных ALU. Возможно, вы, ребята, знаете о других потенциальных источниках состояния гонки.
Однако, поскольку моя цель довольно диаметрально противоположна типичному использованию графического процессора (парллелизация и т. Д.), Для меня довольно сложно понять, как я могу получить доступ к отдельному ALU на низком уровне с помощью общих инструментов.
С наилучшими пожеланиями,