另外,个人认为SSE之类的指令对于内存带宽并没有“加速”的效果,内存的带宽受制于内存本身的带宽和处理器核心到内存控制器之间的总线的带宽。
这类指令虽然能提供更高的操作数宽度,但是并不影响内存带宽。如果只使用Mov之类的指令,应该测得的值是差不多的,而使用支持256bit的AVX也一样。
记得在N多年前针对Nehalem价格(可以认为这是现在的I记CPU架构鼻祖)的资料上看到,内存操作数指令的延迟都非常大,再加上支持4指令发射,不会出现由于质量操作位宽不够导致内存性能被浪费的情况,如果是这样的话,64位系统下性能会比32位高出很多很多……