Saltar al contenido principal

Cómo Funciona

AlphaCube se basa en el método de aprendizaje profundo de EfficientCube (TMLR'23), introduciendo características para una experiencia de resolución más flexible y potente.

Las características clave incluyen:

  1. Un equilibrio ajustable entre velocidad y calidad, controlado mediante el ajuste del ancho de búsqueda.
  2. Resolución ergonómica, que sesga la búsqueda para encontrar soluciones que son más rápidas de ejecutar con las manos.

Estas características son posibles gracias a la naturaleza probabilística del método subyacente.

El Método Central: EfficientCube

En esencia, AlphaCube utiliza una Red Neuronal Profunda (DNN) entrenada para predecir la probabilidad de que los movimientos acerquen un cubo desordenado al estado resuelto. El solucionador aplica secuencialmente los mejores movimientos para encontrar una solución.

Conceptual overview of the method introduced by EfficientCube

Internamente, en lugar de elegir un solo movimiento, la DNN genera una distribución de probabilidad sobre todos los posibles siguientes movimientos, evaluando la calidad de cada candidato.

Probability distribution of optimal moves

Usando estas probabilidades, el solucionador emplea un algoritmo de búsqueda en haz (beam search) para explorar un conjunto limitado de las secuencias de movimientos más prometedoras. Al ajustar el parámetro beam_width, controlas cuántas secuencias se exploran, lo que te permite intercambiar tiempo de cómputo por soluciones más cortas y de mayor calidad.

Soluciones de Velocidad Óptima

Aprovechando el núcleo probabilístico, AlphaCube puede encontrar soluciones que no solo son cortas, sino también ergonómicas. Esto se logra aplicando un sesgo ergonómico.

Al proporcionar un diccionario de preferencias de movimiento (ergonomic_bias), defines una especie de distribución de deseabilidad. El solucionador combina esto con las probabilidades predichas por el modelo, sesgando la búsqueda para favorecer movimientos que son tanto casi óptimos como fáciles de realizar, lo que conduce a un tiempo de ejecución mínimo.

Applying the desirability distribution for biasing

Esto replantea la búsqueda como encontrar el camino más corto en un grafo ponderado, donde los pesos de las aristas representan su facilidad de ejecución. Al ajustar el sesgo a tu preferencia, obtienes soluciones que no solo son eficientes, sino que están verdaderamente optimizadas para tus dedos.