LLM과 인간 모두 편향을 보임: TTS 음성 매력도 순위 실험

2025-03-10

작년에 저자는 LLM을 사용하여 Hacker News 사용자를 순위 매기고 모델이 프롬프트에서 처음 언급된 사용자를 항상 선호하는 편향을 발견했습니다. 올해, TTS 음성 매력도를 순위 매기는 새로운 실험에서 화면 오른쪽에 표시된 음성을 선호하는 유사한 편향이 인간 참가자에게서도 나타났습니다. 이는 저자의 이전 발견을 강화하고 AI와 인간의 판단을 모두 사용할 때 편향을 줄이기 위해 샘플 크기와 무작위화의 중요성을 강조합니다.