大型语言模型和人类都存在偏见:一个TTS语音吸引力排名实验

2025-03-10

作者去年用大型语言模型对Hacker News用户进行排名,发现模型存在偏见,总是倾向于选择提示中先出现的用户。今年,作者进行了一个新的实验,让人类评价TTS语音的吸引力,结果发现人类也存在偏见,倾向于选择屏幕右侧的语音。这印证了作者之前的发现,并强调了在使用AI和人类进行排名时,需要考虑样本量和随机化等因素以减少偏见。