Effizientes Lösen des Rubik's Cubes durch gelernte Repräsentationen: Keine handgefertigten Heuristiken nötig
In der klassischen KI basiert die Wahrnehmung auf dem Lernen räumlicher Repräsentationen, während die Planung – das zeitliche Schließen über Aktionssequenzen – typischerweise durch Suche erreicht wird. Diese Arbeit untersucht Repräsentationen, die sowohl räumliche als auch zeitliche Strukturen erfassen. Standardmäßiges temporales kontrastives Lernen scheitert oft aufgrund von Scheinmerkmalen. Die Autoren stellen kontrastive Repräsentationen für das zeitliche Schließen (CRTR) vor, die negatives Sampling verwenden, um diese Scheinmerkmale zu entfernen und das zeitliche Schließen zu verbessern. CRTR zeichnet sich bei komplexen zeitlichen Aufgaben wie Sokoban und Rubik's Cube aus und löst letzteres schneller als BestFS (wenn auch mit längeren Lösungen). Bemerkenswert ist, dass dies die erste Demonstration ist, wie man beliebige Rubik's Cube-Zustände effizient löst, indem man nur gelernte Repräsentationen verwendet und auf handgefertigte Suchheuristiken verzichtet.