LLMの限界:アインシュタインのなぞなぞが明らかにするTransformerベースAIの制約
2025-02-02

研究者たちは、現在のTransformerベースの大規模言語モデル(LLM)が、複合的な推論タスクを解く能力に根本的な限界があることを発見しました。アインシュタインの論理パズルや多桁の乗算に関する実験では、大規模なファインチューニング後でも著しい欠陥が明らかになりました。これらの知見は、Transformerアーキテクチャが普遍的な学習に適しているかどうかという疑問を提起し、LLMの推論能力を高めるための代替アプローチ(改良されたトレーニングデータや思考連鎖プロンプトなど)の研究を促しています。
AI
複合推論