Как выйти из цикла при использовании sse intrinsics?

__m128* pSrc1 = (__m128*) string;
__m128 m0 = _mm_set_ps1(0);    //null character

while(1)
{
    __m128 result = __m128 _mm_cmpeq_ss(*pSrc1, m0);

    //if character is \0 then break

    //do some stuff here

    pSrc1++;
}

У меня есть строка, длина которой может быть кратной 16. Как выйти из цикла, если _mm_cmpeq_ss возвращает равные?

Ответ 1

Если вы пытаетесь вырваться из цикла, когда вы впервые сталкиваетесь с \0, вам нужно сделать что-то вроде этого:

__m128i* pSrc1 = (__m128i *)string;         // init pointer to start of string
__m128i m0 = _mm_set1_epi8(0);              // vector of 16 `\0` characters

while (1)
{
    __m128i v0 = _mm_loadu_si128(pSrc1);    // get 16 chars from string
    __m128i v1 = _mm_cmpeq_epi8(v0, m0);    // compare all 16 chars with '\0'
    int vmask = _mm_movemask_epi8(v1);      // get 16 comparison result bits
    if (vmask != 0)                         // if any bit is 1
        break;                              // we found a `\0`, break out of loop
    pSrc1++;                                // next 16 characters...
}

Если вы хотите протестировать только символы \0 в определенных позициях и игнорировать любые другие, вы можете изменить тест if (vmask != 0) на то, что соответствует вашим конкретным требованиям.