Tenstorrent : Arrêtez d'empiler les abstractions, concentrez-vous sur le calcul IA principal
Cet article critique vivement la conception de l'architecture de calcul IA de Tenstorrent, arguant que sa dépendance excessive aux couches d'abstraction (LLK) conduit à l'inefficacité et l'empêche de concurrencer des géants comme Nvidia. L'auteur conseille à Tenstorrent de se concentrer sur trois modules principaux : le front-end (PyTorch/ONNX, etc.), le compilateur (MLIR/LLVM, etc.) et l'exécution. L'exécution doit être indépendante du matériel, et le compilateur doit se concentrer sur le placement de la mémoire, l'ordonnancement des opérations et la fusion des noyaux, en évitant les fonctions d'activation inutiles comme ELU. L'auteur souligne que seule la simplification de l'architecture et l'amélioration des performances des composants principaux permettront à Tenstorrent de réussir dans le domaine du calcul IA.