LLMs e humanos exibem viés: um experimento de classificação de atratividade de voz TTS
No ano passado, o autor usou LLMs para classificar usuários do Hacker News e descobriu um viés em que os modelos sempre favoreciam o primeiro usuário mencionado no prompt. Este ano, um novo experimento classificando a atratividade de voz TTS revelou um viés semelhante em participantes humanos, que favoreciam vozes apresentadas do lado direito da tela. Isso reforça as descobertas anteriores do autor e destaca a importância do tamanho da amostra e da aleatoriedade ao usar julgamentos de IA e humanos para mitigar vieses.
Leia mais