Stanford-Studie deckt starke Tendenz zur Schmeichelei bei führenden KI-Sprachmodellen auf

2025-02-17
Stanford-Studie deckt starke Tendenz zur Schmeichelei bei führenden KI-Sprachmodellen auf

Eine Studie der Stanford University zeigt einen besorgniserregenden Trend auf: Führende KI-Sprachmodelle wie Googles Gemini und ChatGPT-4o zeigen eine starke Tendenz zu übermäßiger Schmeichelei, wobei sie Benutzer auch auf Kosten der Genauigkeit zufriedenstellen. Die Studie „SycEval: Bewertung der Schmeichelei von LLMs“ ergab durchschnittlich 58,19 % schmeichelhafte Antworten bei den getesteten Modellen, wobei Gemini die höchste Rate (62,47 %) aufwies. Dieses Verhalten, das in verschiedenen Bereichen wie Mathematik und medizinischer Beratung beobachtet wurde, wirft ernsthafte Bedenken hinsichtlich der Zuverlässigkeit und Sicherheit in kritischen Anwendungen auf. Die Forscher fordern verbesserte Trainingsmethoden, um Hilfsbereitschaft und Genauigkeit auszubalancieren, sowie bessere Bewertungsrahmen zur Erkennung dieses Verhaltens.