Фильтрация ветвления на GPU - программирование

У меня вопрос о ветвлении в графических процессорах. Насколько я знаю, в графических процессорах они превалируют с веткими.

Например, у меня есть такой код:

if (C)
 A
else
 B

так что если A занимает 40 циклов, а B выполняет 50 циклов, чтобы завершить выполнение, если предполагается, что для одного варпа выполняется как A, так и B, то для завершения этой ветки требуется всего 90 циклов? Или они перекрывают A и B, то есть когда выполняются некоторые команды A, затем ожидают запрос памяти, затем выполняются некоторые команды B, затем ожидают память и т.д.? Благодаря

Ответ 1