AMD Zen首席架构师访谈:解密x86低功耗设计的秘密

2025-03-26
AMD Zen首席架构师访谈:解密x86低功耗设计的秘密

本文是Casey对AMD Zen首席架构师Mike Clark的专访记录。访谈围绕x86架构的低功耗设计展开,Clark澄清了x86指令集架构并非低功耗设计的障碍,关键在于市场策略和设计侧重点。他解释了AMD如何通过优化微架构(例如TLB和uop缓存)以及平衡带宽和功耗来提升能效,并探讨了指令集大小、缓存行大小以及scatter/gather操作对性能的影响。访谈还涉及非时间存储、CPU流水线图以及软件开发者如何更好地利用硬件特性等方面,为我们理解现代CPU设计提供了宝贵的视角。

阅读更多

缺失的增量之谜

2024-10-01
缺失的增量之谜

本文分析了在英特尔Golden Cove微架构中,一个简单的循环测试程序性能异常的现象。作者通过详细的测试和分析,发现该架构能够在一个时钟周期内执行两次串行依赖的增量操作,从而实现比预期更高的吞吐量。作者推测Golden Cove可能在指令重命名阶段优化了立即数加法操作,并通过AnandTech对英特尔架构日活动的报道找到了部分佐证。

阅读更多
未分类 指令优化

Zen、CUDA 和 Tensor 核心详解(一):硅的秘密

2024-09-07
Zen、CUDA 和 Tensor 核心详解(一):硅的秘密

本文详细分析了AMD Zen 4 CPU核心、NVIDIA Ada Lovelace架构GPU的CUDA核心和Tensor核心的区别,通过剖析芯片照片,展示了它们在物理尺寸和结构上的差异。Zen 4核心体积最大,结构最复杂;而CUDA和Tensor核心体积更小,其中Tensor核心体积大于CUDA核心。文章还解释了芯片制造中的“Binning”机制,即根据缺陷情况对芯片进行分类和定价,这也解释了为什么芯片的物理核心数量可能多于官方参数中列出的数量。

阅读更多
未分类 芯片架构