Demo de inferencia GPT-2 en el navegador con WebGL2
2025-05-02
Este impresionante proyecto lleva la pasada completa hacia adelante del modelo GPT-2 pequeño (117M de parámetros) al navegador usando WebGL2. Aprovechando los shaders WebGL2 para la computación en la GPU y js-tiktoken para la tokenización BPE (sin necesidad de WASM), ejecuta GPT-2 directamente en el navegador. Un script de Python descarga los pesos preentrenados, y el front-end está construido con Vite para la sustitución de módulos en caliente. Este es un ejemplo fantástico de llevar modelos avanzados de IA al navegador, mostrando las capacidades de vanguardia de las tecnologías web.
IA