Webtagr - 科技资讯摘要

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

2025-01-23

Scale AI和人工智能安全中心(CAIS)发布了“人类最后一次考试”的成果，这是一个旨在测试AI在人类专业知识前沿的知识极限的突破性基准测试。测试涵盖数学、人文和自然科学等多个领域，结果显示，目前的AI模型只能正确回答不到10%的专家级问题，这表明AI在复杂推理方面仍有很大的提升空间。该测试使用了超过3000个由专家提供的难题，并对多个领先的AI模型进行了评估，旨在解决现有基准测试饱和的问题。这项研究为未来的AI发展提供了宝贵的参考，并强调了AI安全的重要性。

Scale：一个始终坚持精英管理的企业

2024-06-14

Scale CEO Alexandr Wang 强调公司始终坚持精英管理的用人原则，即 merit, excellence, and intelligence (MEI)。公司认为，精英管理和多元化并不冲突，基于能力的招聘自然会带来多元的背景和观点。Scale 相信，评判一个人应该看其品格，而作为同事，更要看其才能、技能和职业道德。

人类最后一次考试：AI能力的极限测试

Scale：一个始终坚持精英管理的企业