苹果发布新一代多语言多模态基础模型
2025-07-18
苹果公司发布了两款新的多语言、多模态基础语言模型,用于驱动其设备和服务中的智能功能。一款是针对苹果硅芯片优化的约30亿参数的设备端模型,另一款是基于新型并行轨迹混合专家(PT-MoE)Transformer的可扩展服务器端模型。两者都经过大规模多语言和多模态数据集的训练,并通过监督微调和强化学习进一步改进,支持更多语言、图像理解和工具调用。在公开基准测试和人工评估中,这两款模型均达到或超过了同等规模的开源基线。苹果还推出了一个新的Swift为中心的Foundation Models框架,方便开发者集成这些功能。
AI