仕組み
AlphaCubeには以下の特徴があります。
1. レイテンシと品質のスムーズなトレードオフ
AlphaCubeは、レイテンシとソリューションの品質を動的にバランスさせるユニークなトレードオフ機構を提供します。解決に割り当てる時間が長くなるほど、生成されるソリューション はより洗練されたものになります。
2. バイアスを用いたエルゴノミックな解法
AlphaCubeでは、「エルゴノミックバイアス」を適用することで、AIソルバーの動作をカスタマイズできます。この機能により、ソルバーを速度最適化アルゴリズムの発見に偏らせることができ、ユーザーの好みや要件に合わせることができます。
これらの特徴は、以下に説明するAlphaCubeの基本的な方法の確率的性質に裏打ちされています。
EfficientCube
AlphaCubeは、方法論的にEfficientCube (TMLR'23)に基づいています。EfficientCubeは、目標が定義された組合せ最適化問題を解くための最先端のディープラーニング手法です(DeepCubeAを上回る性能)。
その中核では、Deep Neural Network(DNN)が、与えられた状態を目標に一歩近づけるような次の手を予測するように学習されます。EfficientCubeは、これらの予測された手を順次適用して、与えられた課題を解決します。
内部では、DNNは候補手を評価するための最適手の確率分布を出力します。
EfficientCubeは、これらの確率に基づいてソリューション候補を評価します。ビーム探索と呼ばれる探索手法を用いることで、EfficientCubeは計算時間とより良い/より短いソリューションのトレードオフを行います。
ソリューション候補の評価方法など、詳細については、原論文とソースコードを参照してください。
速度最適ソリューション
EfficientCubeの確率的性質を活用することで、エルゴノミック/速度最適なソリューションも得ることができます。
次の手の予測確率分布に「エルゴノミックバイアス分布」を適用することで、AIソルバーの出力を意図的に速度最適性に偏らせることができます。
より具体的には、理論的に最適な手の分布とエルゴノミック/望ましい手の分布の内積を計算することで、次の手の速度最適確率分布が作成されます。技術的には、このア プローチは、ルービックキューブを重み付きの暗黙のグラフとして再定式化し、エッジの長さが手動実行のしやすさを表すようにします。このエルゴノミックバイアスを適切に制御することで、効率的であるだけでなく、あなたの指に合った速度最適ソリューションを得ることができます。