Это вопрос о том, как определить размер CUDA, размеры блоков и потоков. Это дополнительный вопрос к опубликованному здесь:
Следуя этой ссылке, ответ от talonmies содержит фрагмент кода (см. ниже). Я не понимаю значение комментария, которое обычно выбирается настройкой и аппаратными ограничениями.
Я не нашел хорошего объяснения или пояснения, объясняющего это в документации CUDA. Итак, мой вопрос заключается в том, как определить оптимальный размер блока (= количество потоков) с учетом следующего кода:
const int n = 128 * 1024;
int blocksize = 512; // value usually chosen by tuning and hardware constraints
int nblocks = n / nthreads; // value determine by block size and total work
madd<<<nblocks,blocksize>>>mAdd(A,B,C,n);
Кстати, я начал свой вопрос со ссылкой выше, потому что он частично отвечает на мой первый вопрос. Если это не правильный способ задать вопросы о переполнении стека, пожалуйста, извините или сообщите мне.