AI 모델 붕괴: 데이터 오염의 임박한 위협
2025-06-15
2022년 OpenAI의 ChatGPT 출시는 원자폭탄과 같은 충격으로 AI 연구 세계를 바꿔놓았습니다. 이제 연구자들은 'AI 모델 붕괴'를 경고하고 있습니다. 이는 AI 모델이 다른 AI 모델이 생성한 합성 데이터로 훈련되면서 신뢰할 수 없는 결과로 이어지는 현상입니다. 이는 핵 실험으로 인한 금속 오염에 비유되며, '저 배경' 소재가 필요합니다. 연구자들은 2022년 이전에 수집된 '깨끗한' 것으로 간주되는 데이터에 대한 접근을 주장하며, 이러한 붕괴를 방지하고 경쟁을 유지하려고 합니다. 데이터 오염과 독점의 위험을 줄이기 위해 AI 생성 콘텐츠의 강제 라벨링이나 페더레이티드 러닝 장려와 같은 정책적 해결책이 제안되고 있습니다.