Clone do ChatGPT em 3000 bytes de C

2024-12-12

O desenvolvedor Nicholas Carlini criou um clone do ChatGPT usando apenas 3000 bytes de código C, baseado no modelo GPT-2. Esta implementação sem dependências carrega a matriz de pesos e o arquivo BPE do GPT-2, realizando tokenização, operações de matriz, inferência de transformador e detokenização. Embora a qualidade da saída não seja alta, sua eficiência é notável, produzindo várias respostas por segundo em hardware moderno. Isso demonstra o potencial de código compacto na implementação de modelos de IA complexos.

IA IA