大型语言模型与国际象棋的奇怪现象

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

大型语言模型与国际象棋的奇怪现象

2024-11-14

作者测试了多个大型语言模型(LLM)下国际象棋的能力，发现除了gpt-3.5-turbo-instruct外，其他模型的棋力都很差，即使是参数量更大的模型也不例外。作者对比了相同模型的指令微调版本和基础版本，发现指令微调反而降低了模型的棋力。作者提出了几种可能的解释，包括指令微调破坏了模型下棋的能力、gpt-3.5-turbo-instruct训练数据中包含更多棋谱、不同模型的架构差异以及不同类型数据之间的“竞争”。

(dynomight.net)

未分类

OpenMP® ARB 发布 OpenMP 6.0，简化并行编程

Origin 私有文件系统 - Web API