LLM y humanos muestran sesgo: un experimento de clasificación de atractivo de voz TTS

2025-03-10

El año pasado, el autor usó LLM para clasificar usuarios de Hacker News y descubrió un sesgo donde los modelos siempre favorecían al primer usuario mencionado en el prompt. Este año, un nuevo experimento clasificando el atractivo de la voz TTS reveló un sesgo similar en participantes humanos, que favorecían las voces presentadas en el lado derecho de la pantalla. Esto refuerza los hallazgos anteriores del autor y destaca la importancia del tamaño de la muestra y la aleatoriedad al usar juicios de IA y humanos para mitigar sesgos.