无需搜索的国际象棋大师级模型
2024-10-18
这篇文章介绍了一个名为“无需搜索的国际象棋大师级模型”的研究项目。该项目训练了一个2.7亿参数的Transformer模型,用于在下棋时进行策略选择和价值评估,并达到了国际象棋大师级的水平。该模型在包含1000万局棋谱的数据集上进行训练,并使用Stockfish 16引擎提供的行动价值进行标注。研究结果表明,模型的棋力随着模型规模和数据集大小的增加而提高,并且在没有使用任何特定领域调整或显式搜索算法的情况下,成功地解决了一系列具有挑战性的棋局。
21
未分类