文章指出,大型语言模型的响应可以分为信息型和指令型两种。信息型响应类似于问答,提供简短概念性信息,而指令型响应则侧重于提供详细的操作步骤,例如烹饪步骤或数据备份流程。作者认为,现有的评估数据集主要针对信息型响应,缺乏对指令型响应的关注。特别是对于企业内部的领域特定型检索增强生成模型,指令型响应的评估至关重要,因为它直接关系到用户能否正确执行操作。