LongWriter:释放长上下文大型语言模型10,000+ 字的生成能力

2024-10-07

LongWriter 是一种能够生成超过 10,000 字文本的开源大型语言模型。它基于 GLM-4-9B 和 Meta-Llama-3.1-8B 训练,并提供自动化的超长输出数据构建流程 AgentWrite。LongWriter 在 LongBench-Write 和 LongWrite-Ruler 评估基准上取得了优异的成绩,证明了其在长文本生成方面的能力。

20
未分类 长文本生成