OpenAIs o3-System erzielt Durchbruchsergebnis beim ARC-AGI-Benchmark

2024-12-20

OpenAIs neues o3-System, trainiert auf dem öffentlichen ARC-AGI-1-Trainingsdatensatz, erzielte eine bahnbrechende Punktzahl von 75,7 % auf dem semi-privaten Evaluationsdatensatz und übertraf damit die bisherigen Grenzen großer Sprachmodelle. Dies stellt einen bedeutenden Fortschritt in den Fähigkeiten der KI dar und zeigt eine neuartige Fähigkeit zur Anpassung an neue Aufgaben, die zuvor bei Modellen der GPT-Familie nicht beobachtet wurde. Obwohl o3 noch keine Künstliche Allgemeine Intelligenz (AGI) erreicht hat, unterstreicht sein Erfolg die Bedeutung der Neukombination von Wissen zur Testzeit und liefert wertvolle Datenpunkte für die laufende AGI-Forschung. Es bleiben Herausforderungen bestehen, da o3 immer noch bei einigen einfachen Aufgaben scheitert, was die Komplexität der Erreichung echter AGI verdeutlicht.

Mehr lesen
KI