Как я могу получить элементы суммы (уменьшение) вектора float, используя sse intrinsics?
Простой серийный код:
void(float *input, float &result, unsigned int NumElems)
{
result = 0;
for(auto i=0; i<NumElems; ++i)
result += input[i];
}