Tenstorrent: Pare de Empilhar Abstrações, Concentre-se no Cálculo Principal de IA

2025-05-25
Tenstorrent: Pare de Empilhar Abstrações, Concentre-se no Cálculo Principal de IA

Esta postagem critica fortemente o design de arquitetura de computação de IA da Tenstorrent, argumentando que sua dependência excessiva em camadas de abstração (LLK) leva à ineficiência e impede que ela concorra com gigantes como a Nvidia. O autor aconselha a Tenstorrent a se concentrar em três módulos principais: front-end (PyTorch/ONNX, etc.), compilador (MLIR/LLVM, etc.) e tempo de execução. O tempo de execução deve ser independente de hardware, e o compilador deve se concentrar na alocação de memória, agendamento de operações e fusão de kernel, evitando funções de ativação desnecessárias como ELU. O autor enfatiza que apenas simplificando a arquitetura e melhorando o desempenho dos componentes principais, a Tenstorrent poderá ter sucesso no campo da computação de IA.