Когда происходит промахи в кеше, CPU извлекает целую строку кэша из основной памяти в иерархию кэша. (обычно 64 байта на x86_64)
Это делается через шину данных, которая имеет только 8 байтов в современных 64-битных системах. (так как размер слова составляет 8 байт)
EDIT: "Шина данных" означает шину между матрицей CPU и модулями DRAM в этом контексте. Ширина этой шины данных не обязательно соответствует размеру слова.
В зависимости от стратегии сначала запрашивается запрашиваемый адрес, а затем остальная часть строки кэша выбирается последовательно.
Казалось бы, гораздо быстрее, если бы была шина шириной 64 байта, что позволило бы сразу получить целую строку кэша. (это будет в восемь раз больше размера слова)
Возможно, могут быть две разные ширины шины данных: одна для стандартной выборки кеш-линии и одна для внешнего оборудования (DMA), которая работает только с доступом к памяти формата слова.
Каковы ограничения, ограничивающие размер шины данных?