大型语言模型能否准确复述圣经?
2024-12-29

本文探讨了大型语言模型(LLM)准确复述圣经的能力。作者设计了六个测试场景,评估不同规模的LLM对圣经经文的准确记忆能力。结果显示,参数规模较大的模型(如Llama 405B、GPT 4o和Claude Sonnet)表现最佳,能够准确复述各种经文,包括整章内容。而参数规模较小的模型(7B级别)容易混淆不同译本,甚至出现幻觉。中等规模的模型(70B级别)通常能保留经文的原意,但可能混杂多个译本,或略有改动。作者建议,若需准确引用圣经经文,应使用参数规模较大的模型,并辅以实际的圣经文本进行核对。
AI
准确性