工作原理

AlphaCube 基于 EfficientCube (TMLR'23) 的深度学习方法构建，并引入了新功能，以提供更灵活、更强大的求解体验。

主要功能包括：

这些功能得以实现，得益于其底层方法的概率特性。

核心方法：EfficientCube

AlphaCube 的核心是一个深度神经网络 (DNN)，它经过训练可以预测哪些步骤能让打乱的魔方更接近复原状态。求解器会依次应用最佳步骤来找到解法。

EfficientCube 所引入方法的概念性概述

在底层，DNN 不会只选择一个步骤，而是会输出一个关于所有可能下一步的概率分布，评估每个候选步骤的质量。

最优步骤的概率分布

利用这些概率，求解器采用集束搜索 (beam search) 算法来探索一组有限但最有希望的步骤序列。通过调整 beam_width 参数，您可以控制探索的序列数量，从而用计算时间换取更短、质量更高的解法。

利用其概率核心，AlphaCube 不仅能找到短的解法，还能找到顺手的解法。这是通过施加顺手偏好 (ergonomic bias) 来实现的。

通过提供一个步骤偏好字典 (ergonomic_bias)，您可以定义一种期望度分布。求解器将其与模型预测的概率相结合，使搜索偏向于那些既接近最优又易于执行的步骤，从而实现最短的执行时间。

应用期望度分布以施加偏好

这将搜索问题重构为在加权图上寻找最短路径，其中边的权重代表其执行的难易程度。通过根据您的偏好调整偏好值，您得到的解法不仅高效，而且是真正为您的手指量身定制的。