Apertus:一个完全开放的多语言大型语言模型

Apertus是一个具有700亿和80亿参数的完全开放的多语言大型语言模型,支持超过1000种语言和长文本上下文。它使用完全合规的开放训练数据,性能与闭源模型相当。Apertus采用新的xIELU激活函数和AdEMAMix优化器进行训练,并经过监督微调和QRPO对齐。该模型的权重、数据和训练细节均公开,并遵守数据所有者的退出同意权,避免记忆训练数据。Apertus已集成到transformers库中,并支持多种部署方式。虽然性能优异,但仍需注意其可能产生不准确或有偏见的信息。
阅读更多