QB64 搜索技巧 核手提箱 文字记录 海洋云增白 开源地图 Bliss AI 搜索答案 深海沉船 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 世界 PostgreSQL AI工具 证券 DirectX 防溢 DrawingPics Zulip 儿童读物 化学 连续滚动 代码审查 三菱电机 更多

法律人工智能:基准测试查询中,六分之一(或更多)的法律模型出现“幻觉” (hai.stanford.edu)

斯坦福大学的一项新研究表明,法律领域的人工智能工具仍然存在“幻觉”问题,即使是采用检索增强生成(RAG)技术的工具也无法完全避免。研究人员测试了LexisNexis和Thomson Reuters两家公司的法律人工智能产品,发现它们在回答法律问题时错误率仍然较高,分别为17%和34%。研究指出,法律检索的复杂性、法律适用范围的地域性和时间性限制,以及人工智能系统对用户错误假设的盲从性,都是导致“幻觉”的原因。文章强调了对法律人工智能工具进行严格、透明的基准测试和评估的必要性,以确保其可靠性和律师的职业道德。