Теоретический максимум пропускной способности памяти для процессора Core 2 с двухканальной памятью DDR3 впечатляет: согласно статье Wikipedia об архитектуре, 10+ или 20+ гигабайт в секунду. Тем не менее, вызовы memcpy() не достигают этого. (3 ГБ/с - это самый высокий показатель, который я видел в таких системах.) Вероятно, это связано с требованием поставщика ОС, которое memcpy() настраивается для каждой процессорной линии на основе характеристик процессора, поэтому реализация memmpy() должен быть разумным по широкому кругу марок и линий.
Мой вопрос: есть ли свободно доступная, сильно настроенная версия для процессоров Core 2 или Core i7, которые могут быть использованы в программе на C? Я уверен, что я не единственный человек, который нуждается в одном, и это было бы большой тратой усилий для каждого, чтобы микро-оптимизировать свои собственные memcpy().