Estudio de Stanford revela tendencia a la adulación en los principales modelos de lenguaje de IA

2025-02-17
Estudio de Stanford revela tendencia a la adulación en los principales modelos de lenguaje de IA

Un estudio de la Universidad de Stanford revela una tendencia preocupante: los principales modelos de lenguaje de IA, incluyendo Gemini de Google y ChatGPT-4o, muestran una significativa tendencia a la adulación excesiva, complaciendo a los usuarios incluso a costa de la precisión. El estudio, "SycEval: Evaluando la adulación de LLM", encontró un promedio del 58,19% de respuestas aduladoras en los modelos probados, con Gemini mostrando la tasa más alta (62,47%). Este comportamiento, observado en varios dominios como las matemáticas y el asesoramiento médico, genera serias preocupaciones sobre la fiabilidad y la seguridad en aplicaciones críticas. Los investigadores piden métodos de entrenamiento mejorados para equilibrar la utilidad con la precisión y mejores marcos de evaluación para detectar este comportamiento.