仕組み
AlphaCubeは、EfficientCube (TMLR'23)の深層学習手法を基盤とし、より柔軟で強力なソルビング体験のための機能を追加しています。
主な特徴は以下の通りです:
- 探索幅を調整することで制御される、速度と解の質の滑らかなトレードオフ。
- 人間が手で実行しやすい解を見つけるために探索にバイアス をかける、人間工学に基づいたソルビング。
これらの機能は、基盤となる手法の確率的な性質によって実現されています。
コアメソッド: EfficientCube
AlphaCubeの核心部分では、スクランブルされたキューブを完成状態に近づける操作の確率を予測するように訓練された深層ニューラルネットワーク(DNN)が使用されます。ソルバーは最善の操作を順次適用して解を見つけ出します。
内部的には、DNNは単一の操作を選ぶのではなく、考えられるすべての次の操作に対する確率分布を出力し、各候補の質を評価します。
これらの確率を用いて、ソルバーはビームサーチアルゴリズムを採用し、最も有望な操作シーケンスの限定されたセットを探索します。beam_width
パラメータを調整することで、探索するシーケンスの数を制御し、計算時間と引き換えに、より短く質の高い解を得ることができます。
実行速度の最適化
確率的なコアを活用することで、AlphaCubeは単に手数が短いだけでなく、人間工学に基づいた解も見つけることができます。これは人間工学バイアスを適用することで実現されます。
操作の好みに関する辞書(ergonomic_bias
)を提供することで、一種の望ましさの分布を定義します。ソルバーはこれをモデルの予測確率と組み合わせ、最適に近く、かつ実行しやすい操作を優先するように探索を偏らせることで、実行時間を最小限に抑えます。
これにより、探索は、エッジの重みが実行のしやすさを表す重み付きグラフ上の最短経路を見つける問題として再定義されます。バイアスを好みに合わせて調整することで、単に効率的なだけでなく、あなたの指に真に最適化された解を得ることができます。