Если я запускаю свое ядро с сеткой, чьи блоки имеют размеры:
dim3 block_dims(16,16);
Как блокировка блоков теперь разбивается на перекосы? Первые две строки такого блока образуют одну деформацию, или первые два столбца, или это произвольно-упорядоченное?
Предположим, что вычислительная способность GPU составляет 2.0.