Как это работает
AlphaCube основан на методе глубокого обучения из EfficientCube (TMLR'23), добавляя функции для более гибкого и мощного процесса сборки.
Ключевые особенности:
- Плавный компромисс между скоростью и качеством, управляемый настройкой ширины поиска.
- Эргономичная сборка, которая смещает поиск в сторону решений, более быстрых для выполнения человеческими руками.
Эти возможности реализованы благодаря вероятностной природе основного метода.
Основной метод: EfficientCube
В своей основе AlphaCube использует глубокую нейронную сеть (DNN), обученную предсказывать вероятность того, что определенные ходы приблизят разобранный кубик к собранному состоянию. Решатель последовательно применяет лучшие ходы для нахождения решения.
Под капотом, вместо выбора одного единственного хода, DNN выдает распределение вероятностей по всем возможным следующим ходам, оценивая качество каждого кандидата.
Используя эти вероятности, решатель применяет алгоритм лучевого поиска (beam search) для исследования ограниченного набора наиболее перспективных последовательностей ходов. Регулируя параметр beam_width
, вы контролируете количество исследуемых последовательностей, что позволяет обменивать время вычислений на более короткие и качественные решения.
Решения, оптимальные по скорости
Используя вероятностную основу, AlphaCube может находить решения, которые не просто короткие, но и эргономичные. Это достигается путем применения эргономического смещения.
Предоставляя словарь предпочтений ходов (ergonomic_bias
), вы определяете своего рода распределение желательности. Решатель объединяет его с предсказанными вероятностями модели, смещая поиск в пользу ходов, которые одновременно близки к оптимальным и легки в исполнении, что приводит к минимальному времени выполнения.
Это переформулирует задачу поиска как нахождение кратчайшего пути на взвешенном графе, где веса ребер представляют легкость их выполнения. Настраивая смещение в соответствии с вашими предпочтениями, вы получаете решения, которые не просто эффективны, а действительно оптимизированы для ваших пальцев.