Roji robotov lahko učinkoviteje delujejo v skladiščih, iščejo preživele po naravnih nesrečah ali skupaj nadzirajo obsežna območja, a le, če znajo učinokvito komunicirati. Raziskovalci Fakultete za strojništvo Univerze v Ljubljani so razvili novo metodo strojnega učenja, ki omogoča usklajeno sodelovanje več kot 100 robotov. Metoda postavlja temelje za zanesljivejše in bolj razširljive sisteme avtonomnih mobilnih robotov v industriji in storitvenih dejavnostih.
Z naraščajočim številom avtonomnih mobilnih robotov v skladiščih, tovarnah in storitvenih okoljih postaja njihovo medsebojno sodelovanje vse pomembnejše: skupina nalogo opravi hitreje, se hitreje odzove na lokalne dogodke in je odpornejša na okvare. A z večanjem števila robotov se hitro pojavijo težave. Prostor skupnih dejanj raste eksponentno, komunikacijski kanali so hitro preobremenjeni, signali posameznih robotov pa se izgubijo v šumu sočasnih sporočil.
Dosedanji pristopi spodbujevalnega učenja (ang. reinforcement learning) so se osredotočali na manjše skupine ali poenostavljene scenarije brez vizualnega zaznavanja. Učinkovito učenje sporazumevanja v velikih skupinah robotov, ki bi okolje zaznavali s kamerami, je ostajalo odprt problem.

Raziskovalci so razvili Century Maze, simulirano okolje za sodelovalno navigacijo velikih skupin robotov, in dve novi komponenti učenja, ki med njimi omogočita uspešno usklajevanje.

Prva, odvedljivo medagentno učenje predstav (ang. differentiable inter-agent belief learning), robote uči, da svoje predstave o ciljih sooblikujejo na podlagi opazovanj sosedov, in skozi komunikacijski kanal posreduje jasen učni signal. Druga, podoživljanje informativnih dogodkov (ang. informative event replay), pa v postopku učenja zaznava in ohranja redke, a ključne dogodke za razvoj sporazumevanja. Pristop presega obstoječe metode tudi v realističnih razmerah z motnjami v komunikaciji ter spremenljivimi vizualnimi in fizikalnimi pogoji.

Članek je bil objavljen v reviji IEEE Transactions on Robotics (IF 10.5 za 2024), izvorna koda, naučeni modeli in drugo gradivo pa so javno dostopni na spletnem repozitoriju (https://github.com/JernejPuc/centurymaze).
Raziskavo sta podprli Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije (ARIS) v okviru programa P2-0270 in projekta L2-60153.
Jernej Puc, Gašper Škulj, Jan Pleterski, Primož Podržaj, Rok Vrabič
Fakulteta za strojništvo, Univerza v Ljubljani
