ChatGPT-4o 数学能力测试 (第二部分)

2024-05-16
ChatGPT-4o 数学能力测试 (第二部分)

本文介绍了作者对 OpenAI 的多模态模型 ChatGPT-4o 进行数学能力测试的实验。作者设计了五种实验,分别测试了单一模态(仅文本)、多模态(文本+图像)和提示工程(思维链)对模型求解数学问题的影响。实验结果表明,单一模态的文本+零样本思维链提示工程的组合取得了最佳效果,能够三次全部正确解答数学问题。作者认为,虽然多模态提供了更多上下文信息,但在某些情况下可能会导致模型误解,影响求解结果的准确性。

未分类