AI模型崩溃:数据污染的隐忧

2025-06-15
AI模型崩溃:数据污染的隐忧

ChatGPT的出现如同原子弹爆炸般改变了AI研究领域。随之而来的是AI模型训练数据被AI合成数据污染的担忧,即“AI模型崩溃”。文章类比低本底钢材(用于制造对辐射敏感的设备),指出在2022年AI爆发前收集的数据如同“低本底数据”,是干净的训练数据来源。研究人员警告,AI数据污染将导致模型不可靠,并加剧市场垄断。他们呼吁采取措施,例如强制标记AI内容、推广联邦学习,以保护干净的数据来源,防止AI模型崩溃,维护AI领域的公平竞争。