Вопросы по теме 'pgi-accelerator'

PGI openACC: целевое устройство с графическим процессором
У меня две карты NVIDIA: $ ls /dev/nv* /dev/nvidia0 /dev/nvidia1 /dev/nvidiactl /dev/nvidia-uvm Как настроить таргетинг на конкретную карту с помощью pgcc? Как убедиться, что код сгенерирован для nvidia0 (device = 0) или nvidia1 (device =...
1373 просмотров
schedule 24.10.2021

OpenACC: сложный цикл несет зависимость от '* (* (b))' предотвращает распараллеливание
Я использую OpenACC с динамическим распределением массивов. Вот как я распределяю: float **a; float **b; float **c; float **seq; a=(float**)malloc(SIZE*sizeof(float*)); b=(float**)malloc(SIZE*sizeof(float*));...
2780 просмотров
schedule 30.01.2023

Как напрямую (без использования указателя в качестве параметра функции) получить доступ к массивам на графическом процессоре в вычислительных регионах OpenAcc?
У меня есть следующий простой фрагмент кода, состоящий из 4 файлов: //Data.h: #ifndef DATA_H #define DATA_H constexpr int N=10000000; namespace data{ float particles[N]; float outputArray[N]; } #endif //Process.h: #ifndef PROCESS_H #define...
174 просмотров
schedule 05.08.2023

Матмуль в цикле OpenACC Fortran
Ускорение кода Fortran с помощью OpenACC с использованием компилятора PGI, у меня возникли проблемы с вызовом matmul в ускоренном цикле. В упрощенном примере я применяю единичную матрицу к двум векторам, поэтому входные и выходные значения должны...
50 просмотров
schedule 12.12.2022