QB64 搜索技巧 核手提箱 文字记录 海洋云增白 开源地图 Bliss AI 搜索答案 深海沉船 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 世界 PostgreSQL AI工具 证券 DirectX 防溢 DrawingPics Zulip 儿童读物 化学 连续滚动 代码审查 三菱电机 更多

LMSYS Chatbot Arena:实时和社区驱动的LLM评估 (lmsys.org)

LMSYS Chatbot Arena是一个开源项目,旨在通过实时、开放和社区驱动的评估来推进LLM的发展和理解。该平台允许用户通过在实际用例中的成对比较来评价LLM,并定期发布排行榜。自2023年5月推出以来,Chatbot Arena已成为一个重要的LLM评估平台,吸引了数百万参与者,收集了超过80万张投票,用于评估90多个LLM。该项目致力于开放科学,分享用户偏好数据和一百万个用户提示,支持研究和模型改进。