大型语言模型与国际象棋的奇怪现象

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

大型语言模型与国际象棋的奇怪现象

2024-11-14

本文探讨了大型语言模型（LLM）在国际象棋中表现的奇怪现象。作者通过实验发现，一年前被认为可以达到高级业余水平的LLM，如今除了gpt-3.5-turbo-instruct外，其他模型的表现都非常糟糕，即使是参数量更大的模型也无法胜任。作者提出了四种可能的解释：指令微调破坏了基础模型的棋力、GPT-3.5-instruct接受了更多棋局训练、不同的Transformer架构导致差异、不同类型数据之间的“竞争”。文章最后还讨论了输入提示中空格对模型性能的影响以及分词器的作用。

(dynomight.substack.com)

未分类

托马斯·E·库尔茨讣告（1928-2024）

来自明尼苏达的互联网Gopher