微架构中的执行单元流水线

2024-12-30

本文探讨了乱序微架构中执行单元的流水线化。作者最初认为执行单元在处理完微操作后才会空闲,但以A14和M1中的Firestorm微架构为例,发现两个整数执行单元能够同时处理多个乘法操作,每个乘法操作需要三个周期。通过对比依赖指令序列和独立指令序列的执行时间,作者发现执行单元和微操作的许多组合都高度流水线化,这意味着一个微操作可以在执行单元仍在处理其他微操作时发出。这使得独立指令序列的执行时间从预期的6个周期缩短到4个周期。作者最后解释了指令延迟和带宽表中为何指定倒数吞吐量,因为它等同于周期/指令。

开发 执行单元