Webtagr - Technology News Summarizer

Popular：

Virtualization DNS security formal verification reachability analysis compiler errors macro conflict web extension development framework Bitmap Graphics API inconsistencies All Tags

StructLM: 构建用于结构化知识基础的通用模型

2024-05-04

大型语言模型 (LLM) 在处理结构化数据方面能力不足，例如，ChatGPT 在结构化知识基础 (SKG) 方面的表现落后于最先进 (SoTA) 模型平均 35%。为了增强 LLM 的 SKG 能力，研究人员开发了一个包含 110 万个示例的指令调整数据集，并基于 Mistral 和 CodeLlama 模型系列训练了一系列名为 StructLM 的模型，参数范围从 70 亿到 340 亿不等。StructLM 系列在 18 个评估数据集中有 16 个超过了特定任务模型，并在 8 个 SKG 任务上建立了新的 SoTA 性能。

(arxiv.org)

未分类逻辑推理结构化知识基础指令调整