Как я могу получить элементы суммы (уменьшение) вектора float, используя sse intrinsics?
Простой серийный код:
void(float *input, float &result, unsigned int NumElems)
{
     result = 0;
     for(auto i=0; i<NumElems; ++i)
         result += input[i];
}
