Как правило, часто предпочтительнее избегать многократного копирования данных из ОЗУ в память графического процессора, если вместо этого данные могут оставаться в памяти графического процессора. В результате некоторые коды хранят наборы данных в памяти графического процессора как общую переменную (пример).
Есть ли в Theano какой-либо способ количественно определить, сколько данных копируется в графический процессор при выполнении скрипта? Моя цель - оценить, в какой степени отсутствие объявления набора данных как общей переменной замедляет работу программы из-за копирования данных из ОЗУ в память графического процессора. (объявление набора данных в качестве общей переменной в скрипте, который я сейчас профилирую, потребует некоторых изменений кода, поэтому я предпочел бы получить оценку, прежде чем погружаться в код).