У кого-нибудь есть опыт использования инструкций предварительной выборки для процессора Core 2 Duo?
Я успешно использовал набор стандартной выборки (prefetchnta
, prefetcht1
и т.д.) для серии P4-машин, но при запуске кода на Core 2 Duo кажется, что prefetcht(i)
ничего не делают и что команда prefetchnta
менее эффективна.
Мои критерии оценки производительности - это временные результаты для векторной векторной операции BLAS 1 (axpy), когда размер вектора достаточно велик для поведения вне кэша.
Установили ли Intel новые инструкции по предварительной выборке?