开源工具揭秘大型语言模型内部运作

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

2025-05-29

Anthropic公司开源了一套新工具，用于追踪大型语言模型的“思维过程”。该工具生成属性图，可视化模型内部决策步骤。用户可在Neuronpedia平台上交互式探索这些图，研究模型的多步推理和多语言表示等行为。此举旨在促进对大型语言模型可解释性的研究，弥合AI能力进步和对其内部机制理解之间的差距。

(www.anthropic.com)