跳到主要内容

工作原理

AlphaCube 基于 EfficientCube (TMLR'23) 的深度学习方法构建,并引入了新功能,以提供更灵活、更强大的求解体验。

主要功能包括:

  1. 在速度和质量之间平滑取舍,通过调整搜索宽度来控制。
  2. 顺手解法求解,通过对搜索施加偏好,以找到更适合人手快速执行的解法。

这些功能得以实现,得益于其底层方法的概率特性。

核心方法:EfficientCube

AlphaCube 的核心是一个深度神经网络 (DNN),它经过训练可以预测哪些步骤能让打乱的魔方更接近复原状态。求解器会依次应用最佳步骤来找到解法。

EfficientCube 所引入方法的概念性概述

在底层,DNN 不会只选择一个步骤,而是会输出一个关于所有可能下一步的概率分布,评估每个候选步骤的质量。

最优步骤的概率分布

利用这些概率,求解器采用集束搜索 (beam search) 算法来探索一组有限但最有希望的步骤序列。通过调整 beam_width 参数,您可以控制探索的序列数量,从而用计算时间换取更短、质量更高的解法。

手速最优解法

利用其概率核心,AlphaCube 不仅能找到短的解法,还能找到顺手的解法。这是通过施加顺手偏好 (ergonomic bias) 来实现的。

通过提供一个步骤偏好字典 (ergonomic_bias),您可以定义一种期望度分布。求解器将其与模型预测的概率相结合,使搜索偏向于那些既接近最优又易于执行的步骤,从而实现最短的执行时间。

应用期望度分布以施加偏好

这将搜索问题重构为在加权图上寻找最短路径,其中边的权重代表其执行的难易程度。通过根据您的偏好调整偏好值,您得到的解法不仅高效,而且是真正为您的手指量身定制的。