Hogyan működik
Az AlphaCube az EfficientCube (TMLR'23) mélytanulási módszerére épül, új funkciókat vezetve be a rugalmasabb és hatékonyabb megoldási élmény érdekében.
A főbb jellemzők a következők:
- Sima kompromisszum a sebesség és a minőség között, amelyet a keresési szélesség beállításával lehet szabályozni.
- Ergonomikus megoldás, amely a keresést olyan megoldások felé torzítja, amelyeket az emberi kéz gyorsabban tud végrehajtani.
Ezeket a funkciókat az alapul szolgáló módszer valószínűségi jellege teszi lehetővé.
Az alapmódszer: EfficientCube
Lényegében az AlphaCube egy Mély Neurális Hálót (DNN) használ, amelyet arra tanítottak be, hogy megjósolja annak a valószínűségét, hogy mely lépések viszik közelebb a kevert kockát a megoldott állapothoz. A megoldó egymás után alkalmazza a legjobb lépéseket, hogy megtalálja a megoldást.
A motorháztető alatt, ahelyett, hogy csak egyetlen lépést választana, a DNN egy valószínűségeloszlást ad ki az összes lehetséges következő lépésre, értékelve minden jelölt minőségét.
Ezeket a valószínűségeket felhasználva a megoldó egy nyalábalapú keresési (beam search) algoritmust alkalmaz, hogy a legígéretesebb lépéssorozatok egy korlátozott készletét vizsgálja meg. A beam_width
paraméter beállításával szabályozhatja, hogy hány sorozatot vizsgáljon meg, lehetővé téve, hogy a számítási időt rövidebb, jobb minőségű megoldásokra cserélje.