При использовании инструкций SSE2, таких как PADDD
(т.е. _mm_add_epi32
intrinsic), есть ли способ проверить, не переполнилось ли какое-либо из операций?
Я думал, что, возможно, флаг в регистре управления MXCSR может быть установлен после переполнения, но я этого не вижу. Например, _mm_getcsr()
печатает одно и то же значение в обоих случаях ниже (8064):
#include <iostream>
#include <emmintrin.h>
using namespace std;
void main()
{
__m128i a = _mm_set_epi32(1, 0, 0, 0);
__m128i b = _mm_add_epi32(a, a);
cout << "MXCSR: " << _mm_getcsr() << endl;
cout << "Result: " << b.m128i_i32[3] << endl;
__m128i c = _mm_set_epi32((1<<31)-1, 3, 2, 1);
__m128i d = _mm_add_epi32(c, c);
cout << "MXCSR: " << _mm_getcsr() << endl;
cout << "Result: " << d.m128i_i32[3] << endl;
}
Есть ли другой способ проверить переполнение с помощью SSE2?