Я пытаюсь реализовать некоторый встроенный ассемблер (в коде C/С++), чтобы воспользоваться SSE. Я хотел бы скопировать и дублировать значения (из регистра XMM или из памяти) в другой регистр XMM. Например, предположим, что у меня есть некоторые значения {1, 2, 3, 4} в памяти. Я бы хотел скопировать эти значения таким образом, чтобы xmm1 заполнялся {1, 1, 1, 1}, xmm2 с {2, 2, 2, 2} и т.д. И т.д.
Просматривая справочные руководства Intel, я не мог найти инструкции для этого. Нужно ли мне просто использовать комбинацию повторяющихся MOVSS и вращаться (через PSHUFD?)?