У меня есть очень высокочувствительный код. Реализация SIMD с использованием SSEn и AVX использует около 30 инструкций, а версия, использующая таблицу поиска 4096 байт, использует около 8 инструкций. В микробизнесе таблица поиска быстрее на 40%. Если я микрофункции, пытаясь сделать недействительным кеш-память на 100 итераций, они будут примерно одинаковыми. В моей реальной программе кажется, что версия без загрузки выполняется быстрее, но действительно сложно получить неплохое измерение, и у меня были измерения в обоих направлениях.
Мне просто интересно, есть ли хорошие способы подумать о том, какой из них лучше использовать, или о стандартных методах сравнительного анализа для такого решения.