У кого-нибудь есть опыт использования инструкций предварительной выборки для процессора Core 2 Duo?
Я успешно использовал набор стандартной выборки (prefetchnta, prefetcht1 и т.д.) для серии P4-машин, но при запуске кода на Core 2 Duo кажется, что prefetcht(i) ничего не делают и что команда prefetchnta менее эффективна.
Мои критерии оценки производительности - это временные результаты для векторной векторной операции BLAS 1 (axpy), когда размер вектора достаточно велик для поведения вне кэша.
Установили ли Intel новые инструкции по предварительной выборке?