Wie es funktioniert
AlphaCube führt die folgenden Funktionen ein:
1. Reibungsloser Kompromiss zwischen Latenz und Qualität
AlphaCube bietet einen einzigartigen Kompromissmechanismus, der Latenz und Lösungsqualität dynamisch ausbalanciert. Wenn Sie mehr Zeit zum Lösen einräumen, werden die generierten Lösungen zunehmend verfeinert.
2. Ergonomisches Lösen mit Biasing
AlphaCube ermöglicht es Ihnen, das Verhalten des KI-Solvers anzupassen, indem Sie einen "ergonomischen Bias" anwenden. Diese Funktion erlaubt es Ihnen, den Solver in Richtung geschwindigkeitsoptimaler Algorithmen zu lenken, die Ihren Präferenzen und Anforderungen entsprechen.
Diese Funktionen basieren auf der probabilistischen Natur der grundlegenden Methode von AlphaCube, wie unten beschrieben.
EfficientCube
AlphaCube baut methodisch auf EfficientCube (TMLR'23) auf, der modernsten Deep-Learning-Methode zur Lösung von zieldefinierten kombinatorischen Problemen (und übertrifft dabei DeepCubeA).
Im Kern wird ein Deep Neural Network (DNN) trainiert, um die nächsten Züge vorherzusagen, die einen gegebenen Zustand einen Schritt näher an das Ziel bringen würden. EfficientCube wendet diese vorhergesagten Züge sequenziell an, um die gegebene Herausforderung zu lösen.
Unter der Haube gibt das DNN eine Wahrscheinlichkeitsverteilung optimaler Züge aus, um Kandidatenzüge zu bewerten.
EfficientCube bewertet Lösungskandidaten basierend auf diesen Wahrscheinlichkeiten. Durch den Einsatz einer Suchmethode namens Beam-Suche tauscht EfficientCube Rechenzeit gegen bessere/kürzere Lösungen ein.
Weitere Details, wie z.B. wie Lösungskandidaten bewertet werden, finden Sie im Originalpapier und im Quellcode.
Geschwindigkeitsoptimale Lösungen
Durch Ausnutzung der probabilistischen Natur von EfficientCube können wir auch ergonomische/geschwindigkeitsoptimale Lösungen erhalten.
Durch Anwendung einer "ergonomischen Bias-Verteilung" auf die vorhergesagte Wahrscheinlichkeitsverteilung der nächsten Züge kann die Ausgabe des KI-Solvers absichtlich in Richtung Geschwindigkeitsoptimalität verzerrt werden:
Genauer gesagt, die Berechnung des Skalarprodukts zwischen den Verteilungen der theoretisch optimalen Züge und der ergonomischen/wünschenswerten Züge erzeugt eine geschwindigkeitsoptimale Wahrscheinlichkeitsverteilung für die nächsten Züge. Technisch gesehen formuliert dieser Ansatz den Rubik's Cube als einen gewichteten impliziten Graphen um, bei dem die Kantenlängen ihre Leichtigkeit der manuellen Ausführung darstellen. Die richtige Steuerung dieses ergonomischen Bias nach Ihren Vorlieben gibt Ihnen nicht nur effiziente, sondern auch geschwindigkeitsoptimale Lösungen, die zu Ihren Fingern passen.