QB64 搜索技巧 核手提箱 文字记录 海洋云增白 开源地图 Bliss AI 搜索答案 深海沉船 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 世界 PostgreSQL AI工具 证券 DirectX 防溢 DrawingPics Zulip 儿童读物 化学 连续滚动 代码审查 三菱电机 更多

大型语言模型能否创造出更好的训练方法? (sakana.ai)

Sakana AI 的研究人员正在探索利用大型语言模型 (LLM) 来改进 AI 研究本身,尤其是在偏好优化算法方面。他们开发了一种名为“LLM²”的自我参照改进过程,使用 LLM 提出和改进新的偏好优化算法。这种方法减少了对人工干预和计算资源的依赖。研究发现,LLM 可以生成优于人工设计的目标函数,其中一种名为 DiscoPOP 的算法在多个评估任务中均达到了最先进的性能。

评论已经关闭!