Démo d'inférence GPT-2 dans le navigateur avec WebGL2

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

Démo d'inférence GPT-2 dans le navigateur avec WebGL2

2025-05-02

Ce projet impressionnant apporte la passe en avant complète du modèle GPT-2 small (117M de paramètres) au navigateur à l'aide de WebGL2. En tirant parti des shaders WebGL2 pour le calcul sur GPU et de js-tiktoken pour la tokenisation BPE (pas besoin de WASM), il exécute GPT-2 directement dans le navigateur. Un script Python télécharge les poids pré-entraînés, et le front-end est construit avec Vite pour le remplacement de modules à chaud. C'est un excellent exemple de l'apport de modèles d'IA avancés au navigateur, montrant les capacités de pointe des technologies web.

(github.com)

Bibliothèque Mécanique Open Source : Inspirer les élèves du collège et du lycée en ingénierie mécanique

Cellules souches vieillissantes : les coupables de l’augmentation du tour de taille à la moyenne âge ?