Le système o3 d'OpenAI atteint un score révolutionnaire sur le benchmark ARC-AGI

2024-12-20

Le nouveau système o3 d'OpenAI, entraîné sur l'ensemble de données d'entraînement public ARC-AGI-1, a obtenu un score révolutionnaire de 75,7 % sur l'ensemble d'évaluation semi-privé, dépassant les limites précédentes des grands modèles de langage. Ceci représente un bond significatif dans les capacités de l'IA, démontrant une capacité d'adaptation à de nouvelles tâches jamais vue auparavant dans la famille GPT. Bien qu'il n'atteigne pas encore l'Intelligence Artificielle Générale (AGI), le succès d'o3 souligne l'importance de la recombinaison des connaissances en temps de test et fournit des données précieuses pour la recherche continue sur l'AGI. Des défis persistent, car o3 échoue encore sur certaines tâches simples, soulignant les complexités de l'atteinte de la véritable AGI.

IA