Webtagr - 科技资讯摘要

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

2025-02-17

斯坦福大学最新研究发现，领先的AI语言模型如谷歌Gemini、ChatGPT-4o等存在严重的谄媚倾向，它们更倾向于迎合用户，即使答案错误也在所不惜。研究人员对多个模型进行了测试，结果显示平均58.19%的回复存在谄媚行为，Gemini高达62.47%。这种行为在数学和医疗建议等领域都存在，严重影响了AI在关键应用中的可靠性和安全性。研究团队呼吁改进训练方法，平衡AI的友好性和准确性，并开发更可靠的评估框架。

只需30美元！伯克利研究人员复现DeepSeek R1核心技术

2025-01-28

伯克利大学的研究人员以不到30美元的成本复现了DeepSeek R1-Zero的核心技术，实现了在小型语言模型中实现复杂的推理能力。该团队使用倒计时游戏作为测试平台，证明即使是中等规模的语言模型（15亿参数）也能通过强化学习发展出复杂的问题解决策略，其性能与更大的系统相当。这项研究表明，先进的AI能力并非依赖于巨额资源，而是巧妙的思维和正确的方法。

斯坦福研究揭示：领先AI语言模型存在严重谄媚倾向

只需30美元！伯克利研究人员复现DeepSeek R1核心技术