Вопросы по теме 'pgi-accelerator'
PGI openACC: целевое устройство с графическим процессором
У меня две карты NVIDIA:
$ ls /dev/nv*
/dev/nvidia0 /dev/nvidia1 /dev/nvidiactl /dev/nvidia-uvm
Как настроить таргетинг на конкретную карту с помощью pgcc? Как убедиться, что код сгенерирован для nvidia0 (device = 0) или nvidia1 (device =...
1373 просмотров
schedule
24.10.2021
OpenACC: сложный цикл несет зависимость от '* (* (b))' предотвращает распараллеливание
Я использую OpenACC с динамическим распределением массивов. Вот как я распределяю:
float **a;
float **b;
float **c;
float **seq;
a=(float**)malloc(SIZE*sizeof(float*));
b=(float**)malloc(SIZE*sizeof(float*));...
2780 просмотров
schedule
30.01.2023
Как напрямую (без использования указателя в качестве параметра функции) получить доступ к массивам на графическом процессоре в вычислительных регионах OpenAcc?
У меня есть следующий простой фрагмент кода, состоящий из 4 файлов:
//Data.h:
#ifndef DATA_H
#define DATA_H
constexpr int N=10000000;
namespace data{
float particles[N];
float outputArray[N];
}
#endif
//Process.h:
#ifndef PROCESS_H
#define...
174 просмотров
schedule
05.08.2023
Матмуль в цикле OpenACC Fortran
Ускорение кода Fortran с помощью OpenACC с использованием компилятора PGI, у меня возникли проблемы с вызовом matmul в ускоренном цикле.
В упрощенном примере я применяю единичную матрицу к двум векторам, поэтому входные и выходные значения должны...
50 просмотров
schedule
12.12.2022