Herramienta de código abierto revela el funcionamiento interno de los modelos de lenguaje grandes
2025-05-29
Anthropic ha lanzado una nueva herramienta de código abierto para rastrear los "procesos de pensamiento" de los modelos de lenguaje grandes. Esta herramienta genera gráficos de atribución, visualizando los pasos internos que un modelo realiza para llegar a una decisión. Los usuarios pueden explorar interactivamente estos gráficos en la plataforma Neuronpedia, estudiando comportamientos como el razonamiento en varios pasos y las representaciones multilingües. Este lanzamiento tiene como objetivo acelerar la investigación sobre la interpretabilidad de los modelos de lenguaje grandes, cerrando la brecha entre los avances en las capacidades de IA y nuestra comprensión de su funcionamiento interno.
IA