LLM 에이전트 간 협력의 문화적 진화

2024-12-18

연구원들은 배신에 대한 유인에도 불구하고 '사회'를 형성하는 대규모 언어 모델(LLM) 에이전트가 상호 이익이 되는 사회적 규범을 학습할 수 있는지 조사했습니다. 실험 결과, 기본 모델 간에 협력의 진화에 큰 차이가 있으며, Claude 3.5 Sonnet이 Gemini 1.5 Flash 및 GPT-4o를 크게 능가하는 것으로 나타났습니다. 또한, Claude 3.5 Sonnet은 비용이 드는 처벌 메커니즘을 활용하여 더 높은 점수를 달성했는데, 이는 다른 모델에서는 재현되지 않았습니다. 본 연구는 LLM 에이전트 배포의 사회적 영향에 초점을 맞춘 LLM을 위한 새로운 벤치마크를 제안하고, 더욱 강력하고 협력적인 AI 에이전트 구축에 대한 통찰력을 제공합니다.