Какова стоимость атомной операции (любой из сравнения и замены или атомного добавления/уменьшения)? Сколько циклов он потребляет? Будет ли он приостанавливать другие процессоры на SMP или NUMA или блокирует доступ к памяти? Будет ли он сбросить буфер переупорядочения в процессоре не по порядку?
Какие эффекты будут в кеше?
Мне интересны современные популярные процессоры: x86, x86_64, PowerPC, SPARC, Itanium.