19世纪爱尔兰风格语言模型:Penny-1.7B
2025-06-02
Penny-1.7B是一个17亿参数的因果语言模型,通过群体相对策略优化(GRPO)微调,模仿1840年爱尔兰《便士杂志》的19世纪散文风格。它使用一个训练过的奖励模型来区分原始杂志文本和现代翻译,从而最大限度地提高生成的文本的真实性。该模型适用于创意写作、教育内容或维多利亚时代爱尔兰英语风格的仿写,但不建议用于需要当代事实的场合。
AI