Ferramenta de código aberto revela o funcionamento interno de modelos de linguagem grandes
2025-05-29

A Anthropic lançou uma nova ferramenta de código aberto para rastrear os "processos de pensamento" de modelos de linguagem grandes. Essa ferramenta gera gráficos de atribuição, visualizando as etapas internas que um modelo empreende para chegar a uma decisão. Os usuários podem explorar interativamente esses gráficos na plataforma Neuronpedia, estudando comportamentos como raciocínio em várias etapas e representações multilíngues. Este lançamento visa acelerar a pesquisa sobre a interpretabilidade de modelos de linguagem grandes, fechando a lacuna entre os avanços nas capacidades de IA e nossa compreensão de seu funcionamento interno.
IA