颠覆式LLM:扩散模型的逆袭
2025-03-06
Inception Labs发布了一种名为扩散LLM(dLLM)的新型语言模型,它颠覆了传统自回归模型的生成方式。dLLM并非逐字预测,而是同时生成文本的各个部分,再逐步完善。这种方法在图像和视频模型中已取得成功,如今在代码生成领域也超越了同等规模的传统LLM,速度和效率提升了5-10倍。dLLM的优势在于能够减少传统LLM常见的幻觉问题,先生成关键部分并验证,再继续生成其余内容。这对于需要准确性和一致性的应用,例如客服聊天机器人和智能代理,具有重要意义。dLLM有望改善智能代理的多步骤工作流程,避免陷入循环,提高规划、推理和自我纠正能力。
AI