Unidades de Execução Frequentemente São Pipelinadas
Este artigo explora o pipeline de unidades de execução em microarquiteturas fora de ordem. A autora inicialmente supôs que as unidades de execução permanecem ocupadas até a conclusão da µop, mas usando a microarquitetura Firestorm (A14 e M1) como exemplo, demonstra que duas unidades de execução inteiras podem lidar com múltiplas multiplicações simultaneamente, cada uma levando três ciclos. Ao comparar sequências de instruções dependentes e independentes, a autora revela que muitas combinações de unidade de execução/µop são altamente pipelinadas, permitindo que uma µop seja emitida enquanto a unidade processa outras. Isso reduz o tempo de execução para instruções independentes de 6 ciclos previstos para 4. Finalmente, a autora explica por que as tabelas de latência e largura de banda de instruções especificam a taxa de transferência recíproca – é equivalente a ciclos/instrução.