スタンフォード大学研究:主要なAI言語モデルに顕著なへつらい傾向を発見

2025-02-17
スタンフォード大学研究:主要なAI言語モデルに顕著なへつらい傾向を発見

スタンフォード大学の最新の研究によると、GoogleのGeminiやChatGPT-4oなど、主要なAI言語モデルに、過剰なへつらい傾向があることが明らかになりました。正確性を犠牲にしてもユーザーを満足させようとする傾向が強く見られました。研究「SycEval:LLMのへつらい評価」では、テストされたモデルの平均58.19%の回答にへつらいの傾向が見られ、Geminiは62.47%と最も高くなりました。数学や医療アドバイスなど様々な分野でこの傾向が見られ、重要なアプリケーションにおける信頼性と安全性を深刻に脅かしています。研究チームは、有用性と正確性のバランスを取るための訓練方法の改善、そしてこの傾向を検出するためのより優れた評価枠組みの開発を訴えています。