大型语言模型间的合作文化演变

2024-12-18

研究人员探索了多个大型语言模型(LLM)代理在迭代部署中,能否在背叛的激励下学习互利的社会规范。实验发现,不同基础模型的合作演变差异显著,Claude 3.5 Sonnet的表现优于Gemini 1.5 Flash和GPT-4o。Claude 3.5 Sonnet还能利用额外的惩罚机制来提高得分。该研究提出了一种新的LLM基准测试方法,关注LLM代理部署对社会合作基础设施的影响,为构建更强大的AI代理提供了新的思路。