Anthropic更新负责任规模化政策

2024-10-15

Anthropic发布了其负责任规模化政策 (RSP) 的重大更新,该政策是用于降低前沿人工智能系统潜在灾难性风险的风险治理框架。 此次更新引入了更加灵活和细致的方法来评估和管理人工智能风险,同时坚持在未实施充分保障措施的情况下不训练或部署模型的承诺。 主要改进包括新的能力阈值,用于指示何时升级保障措施;完善的模型能力评估流程和保障措施充分性评估流程(灵感来自安全案例方法);以及内部治理和外部意见的新措施。

未分类