Недавно я обновился от GTX480 до GTX680 в надежде, что утроенное количество ядер проявит себя как значительный прирост производительности в моем коде CUDA. К моему ужасу, я обнаружил, что ядра памяти CUDA с интенсивной памятью работают на 30% -50% медленнее на GTX680.
Я понимаю, что это не просто вопрос программирования, но он напрямую влияет на производительность ядер CUDA на разных устройствах. Может ли кто-нибудь дать представление о спецификациях устройств CUDA и как их можно использовать для вывода их производительности на ядра CUDA C?