Есть ли способ на устройствах CUDA 2.0 отключить кеш L1 только для одной конкретной переменной?
Я знаю, что можно отключить кеш L1 во время компиляции, добавив флаг -Xptxas -dlcm=cg
в nvcc
для всех операций с памятью.
Тем не менее, я хочу отключить кеш только для чтения в памяти по определенной глобальной переменной, чтобы вся остальная часть памяти читала, чтобы пройти через кеш L1.
На основе поиска, который я сделал в Интернете, возможно решение с помощью кода сборки PTX.