Ugrás a fő tartalomhoz

Hogyan működik

Az AlphaCube az EfficientCube (TMLR'23) mélytanulási módszerére épül, új funkciókat vezetve be a rugalmasabb és hatékonyabb megoldási élmény érdekében.

A főbb jellemzők a következők:

  1. Sima kompromisszum a sebesség és a minőség között, amelyet a keresési szélesség beállításával lehet szabályozni.
  2. Ergonomikus megoldás, amely a keresést olyan megoldások felé torzítja, amelyeket az emberi kéz gyorsabban tud végrehajtani.

Ezeket a funkciókat az alapul szolgáló módszer valószínűségi jellege teszi lehetővé.

Az alapmódszer: EfficientCube

Lényegében az AlphaCube egy Mély Neurális Hálót (DNN) használ, amelyet arra tanítottak be, hogy megjósolja annak a valószínűségét, hogy mely lépések viszik közelebb a kevert kockát a megoldott állapothoz. A megoldó egymás után alkalmazza a legjobb lépéseket, hogy megtalálja a megoldást.

Az EfficientCube által bevezetett módszer koncepcionális áttekintése

A motorháztető alatt, ahelyett, hogy csak egyetlen lépést választana, a DNN egy valószínűségeloszlást ad ki az összes lehetséges következő lépésre, értékelve minden jelölt minőségét.

Az optimális lépések valószínűségeloszlása

Ezeket a valószínűségeket felhasználva a megoldó egy nyalábalapú keresési (beam search) algoritmust alkalmaz, hogy a legígéretesebb lépéssorozatok egy korlátozott készletét vizsgálja meg. A beam_width paraméter beállításával szabályozhatja, hogy hány sorozatot vizsgáljon meg, lehetővé téve, hogy a számítási időt rövidebb, jobb minőségű megoldásokra cserélje.

Sebesség-optimális megoldások

A valószínűségi alapokra támaszkodva az AlphaCube nemcsak rövid, hanem ergonomikus megoldásokat is képes találni. Ezt egy ergonomikus torzítás alkalmazásával éri el.

A lépés-preferenciákat tartalmazó szótár (ergonomic_bias) megadásával egyfajta kívánatossági eloszlást határoz meg. A megoldó ezt kombinálja a modell által jósolt valószínűségekkel, eltorzítva a keresést, hogy előnyben részesítse azokat a lépéseket, amelyek egyszerre közel optimálisak és könnyen végrehajthatók, ami minimális végrehajtási időt eredményez.

A kívánatossági eloszlás alkalmazása a torzításhoz

Ez a keresést úgy fogalmazza át, mint a legrövidebb út megtalálását egy súlyozott gráfon, ahol az élsúlyok a végrehajtásuk könnyűségét képviselik. A torzítás saját preferenciái szerinti finomhangolásával olyan megoldásokat kap, amelyek nemcsak hatékonyak, hanem valóban az ujjaira vannak optimalizálva.