开源工具揭秘大型语言模型内部运作
2025-05-29

Anthropic公司开源了一套新工具,用于追踪大型语言模型的“思维过程”。该工具生成属性图,可视化模型内部决策步骤。用户可在Neuronpedia平台上交互式探索这些图,研究模型的多步推理和多语言表示等行为。此举旨在促进对大型语言模型可解释性的研究,弥合AI能力进步和对其内部机制理解之间的差距。
AI
Anthropic公司开源了一套新工具,用于追踪大型语言模型的“思维过程”。该工具生成属性图,可视化模型内部决策步骤。用户可在Neuronpedia平台上交互式探索这些图,研究模型的多步推理和多语言表示等行为。此举旨在促进对大型语言模型可解释性的研究,弥合AI能力进步和对其内部机制理解之间的差距。