Проводились ли какие-либо исследования, сравнивающие производительность OpenCL с OpenMP? В частности, меня интересуют накладные расходы на запуск потоков с помощью OpenCL, например, если нужно разложить домен на очень большое количество отдельных рабочих элементов (каждый из которых выполняется потоком, выполняющим небольшую работу) по сравнению с более тяжелыми потоками веса в OpenMP, домен был разложен на поддомены, число которых равно числу ядер.
Кажется, что модель программирования OpenCL более ориентирована на массивные параллельные чипы (например, графические процессоры), а не на процессоры с меньшим, но более мощным ядерным процессором.
Может ли OpenCL стать эффективной заменой OpenMP?