Demo de inferência GPT-2 no navegador usando WebGL2

2025-05-02
Demo de inferência GPT-2 no navegador usando WebGL2

Este projeto impressionante traz a passagem completa para frente do modelo GPT-2 pequeno (117M de parâmetros) para o navegador usando WebGL2. Aproveitando os shaders WebGL2 para computação na GPU e js-tiktoken para tokenização BPE (sem necessidade de WASM), ele executa o GPT-2 diretamente no navegador. Um script Python baixa os pesos pré-treinados, e o front-end é construído com Vite para substituição de módulos a quente. Este é um exemplo fantástico de trazer modelos avançados de IA para o navegador, mostrando as capacidades de ponta das tecnologias web.

IA