OpenCL standard определяет следующие параметры для получения информации об устройстве и скомпилированном ядре:
-
CL_DEVICE_MAX_COMPUTE_UNITS
-
CL_DEVICE_MAX_WORK_GROUP_SIZE
-
CL_KERNEL_WORK_GROUP_SIZE
-
CL_KERNEL_PREFERRED_WORK_GROUP_SIZE_MULTIPLE
Учитывая эти значения, как я могу рассчитать оптимальный размер рабочей группы и количества рабочих групп?