主题
没有关系,就算是动态指令数也不行。
这是因为 cpu 执行是比较复杂的过程。访存指令遇到 cache miss 直接要等上百个周期,多发射流水线拉满的一个周期就能跑好几条。
所以评估性能离不开 benchmark 测时延。