Tenstorrent:别再堆砌抽象层了,专注构建AI计算核心

2025-05-25
Tenstorrent:别再堆砌抽象层了,专注构建AI计算核心

这篇博文尖锐批评了Tenstorrent的AI计算架构设计,认为其过度依赖抽象层(LLK),导致效率低下,无法与英伟达等巨头竞争。作者建议Tenstorrent聚焦三个核心模块:前端(PyTorch/ONNX等)、编译器(MLIR/LLVM等)和运行时。运行时需具备硬件无关性,编译器专注于内存分配、操作调度和内核融合,避免引入不必要的激活函数如ELU。作者强调,只有简化架构,提升核心组件性能,Tenstorrent才能在AI计算领域取得成功。

硬件 AI计算