실행 유닛은 종종 파이프라이닝됩니다
2024-12-30
이 블로그 게시물은 비순차 마이크로아키텍처에서 실행 유닛의 파이프라이닝을 탐구합니다. 저자는 처음에 실행 유닛이 μop 처리가 완료될 때까지 점유된다고 가정했지만, Firestorm 마이크로아키텍처(A14 및 M1)를 예로 들어 두 개의 정수 실행 유닛이 여러 곱셈을 동시에 처리할 수 있으며 각각 3사이클이 걸린다는 것을 보여줍니다. 종속 명령어 시퀀스와 독립 명령어 시퀀스의 실행 시간을 비교함으로써 많은 실행 유닛/μop 조합이 고도로 파이프라이닝되어 유닛이 다른 μop를 처리하는 동안에도 μop를 발행할 수 있음을 보여줍니다. 이를 통해 독립 명령어 시퀀스의 실행 시간이 예상치인 6사이클에서 4사이클로 단축됩니다. 마지막으로 저자는 명령어 지연 시간과 대역폭 표가 역수 처리량을 지정하는 이유를 설명합니다. 사이클/명령어와 같기 때문입니다.