Когда мне нужно выполнить векторную операцию, которая имеет операнд, который является просто поплавком, передаваемым каждому компоненту, должен ли я прекомпотировать __m256 или __m128 и загружать его, когда мне это нужно, или передавать поплавок в регистр с помощью _mm_set1_ps каждый раз, когда мне нужен вектор?
Я предварительно вычислил векторы, которые очень важны и очень используются и генерируют "на ходу" те, которые менее важны. Но действительно ли я набираю обороты с предварительным вычислением? Это стоит того?
Выполняется ли _mm_set1_ps с помощью одной команды? Это может ответить на мой вопрос.