Résolution efficace du Rubik's Cube grâce à des représentations apprises : Plus besoin d'heuristiques artisanales
Dans l'IA classique, la perception repose sur l'apprentissage de représentations spatiales, tandis que la planification — le raisonnement temporel sur les séquences d'actions — est généralement réalisée par la recherche. Ce travail explore des représentations capturant à la fois la structure spatiale et temporelle. L'apprentissage contrastif temporel standard échoue souvent en raison de caractéristiques fallacieuses. Les auteurs introduisent les Représentations Contrastives pour le Raisonnement Temporel (CRTR), utilisant l'échantillonnage négatif pour supprimer ces caractéristiques et améliorer le raisonnement temporel. CRTR excelle dans les tâches temporelles complexes comme Sokoban et le Rubik's Cube, résolvant ce dernier plus rapidement que BestFS (quoique avec des solutions plus longues). Remarquablement, il s'agit de la première démonstration de résolution efficace d'états arbitraires du Rubik's Cube en utilisant uniquement des représentations apprises, éliminant le besoin d'heuristiques de recherche artisanales.