Я ищу небольшую (4x4) матричную операцию с графикой для SIMD-библиотеки. Там много одиночной точности, но мне нужно поддерживать как единую, так и двойную точность.
Я посмотрел библиотеку Intel IPP MX, но я бы предпочел что-то с источником. Я очень заинтересован в SSE3 + реализациях этих конкретных операций:
- Mat4 * Mat4
- Mat4 * Vec4
- Mat4 * Матрица Mat4
- Mat4 * Array of Vec4
- Преобразование Mat4 (приятно иметь)
РЕДАКТИРОВАТЬ: Никакой "преждевременной оптимизации" не отвечает. Любой, кто работал с маленькими матрицами, знает, что GCC не вектурирует их, а также ручную оптимизированную внутренность или ASM. И в этом случае это важно, или я не стал бы спрашивать.