Я попытался использовать SSE для работы с 4 пикселями. У меня проблема с загрузкой данных изображения в __m128. Мои данные изображения представляют собой буфер char. Скажем, мое изображение 1024 x1024. Мой фильтр 16x16.
__m128 IMG_VALUES, FIL_VALUES, NEW_VALUES;
//ok:
IMG_VALUES=_mm_load_ps(&pInput[0]);
//hang below:
IMG_VALUES=_mm_load_ps(&pInput[1]);
Я не знаю, как обрабатывать индекс 1,2,3... спасибо.