搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

法律人工智能:基准测试查询中,六分之一(或更多)的法律模型出现“幻觉” (hai.stanford.edu)

斯坦福大学的一项新研究表明,法律领域的人工智能工具仍然存在“幻觉”问题,即使是采用检索增强生成(RAG)技术的工具也无法完全避免。研究人员测试了LexisNexis和Thomson Reuters两家公司的法律人工智能产品,发现它们在回答法律问题时错误率仍然较高,分别为17%和34%。研究指出,法律检索的复杂性、法律适用范围的地域性和时间性限制,以及人工智能系统对用户错误假设的盲从性,都是导致“幻觉”的原因。文章强调了对法律人工智能工具进行严格、透明的基准测试和评估的必要性,以确保其可靠性和律师的职业道德。

评论已经关闭!