Le système o3 d'OpenAI atteint un score révolutionnaire sur le benchmark ARC-AGI

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

2024-12-20

Le nouveau système o3 d'OpenAI, entraîné sur l'ensemble de données d'entraînement public ARC-AGI-1, a obtenu un score révolutionnaire de 75,7 % sur l'ensemble d'évaluation semi-privé, dépassant les limites précédentes des grands modèles de langage. Ceci représente un bond significatif dans les capacités de l'IA, démontrant une capacité d'adaptation à de nouvelles tâches jamais vue auparavant dans la famille GPT. Bien qu'il n'atteigne pas encore l'Intelligence Artificielle Générale (AGI), le succès d'o3 souligne l'importance de la recombinaison des connaissances en temps de test et fournit des données précieuses pour la recherche continue sur l'AGI. Des défis persistent, car o3 échoue encore sur certaines tâches simples, soulignant les complexités de l'atteinte de la véritable AGI.