学習済み表現による効率的なルービックキューブ解法:手作業によるヒューリスティック不要
2025-08-29
古典的なAIでは、知覚は空間表現の学習に依存する一方、計画(行動シーケンスに関する時間的推論)は通常、探索によって達成されます。本研究では、空間構造と時間構造の両方を捉える表現から、そのような推論を出現させることができるかどうかを調べます。標準的な時間的コントラスト学習は、見せかけの特徴への依存により、時間構造を捉えることができないことが示されています。これに対処するために、著者らは、時間的推論のためのコントラスト表現(CRTR)を導入し、負例サンプリングスキームを使用して、これらの見せかけの特徴を除去し、時間的推論を促進します。CRTRは、ソコバンやルービックキューブなどの複雑な時間構造を持つドメインで強力な結果を達成します。特にルービックキューブでは、CRTRはすべての初期状態に一般化する表現を学習し、BestFSよりもはるかに高速にパズルを解くことができます(ただし、解は長くなります)。私たちの知る限り、これは、手作業による探索ヒューリスティックを使用せずに、学習済み表現のみを使用して任意のキューブの状態を効率的に解く最初のデモンストレーションです。