大型语言模型微调:数据标注策略改进
2025-08-08
研究人员通过迭代式数据标注,提升了大型语言模型(LLM)的性能。实验使用了两种不同规模的LLM(Gemini Nano-1和Nano-2)以及两个不同复杂度的任务。初始数据为约10万个众包标注,存在严重的类别不平衡问题。通过多次迭代的专家数据筛选和模型微调,模型性能得到显著提升,最终在低复杂度任务上达到约40%的正样本比例,Kappa系数达到0.81,在高复杂度任务上达到0.78,接近专家水平。这表明,高质量的数据标注对提升LLM性能至关重要。
AI