cselekvés randomizálás

Rövid szöveges bemutatás: 
Gyakran felmerül olyan helyzet, hogy az ágens a környezet részleges informiójához fér hozzá. Tehát nem látja a környezet minden információját. Így előfordulhat, hogy pont olyan információhoz nem tud hozzáférni, ami alapján a megfelelő döntést tudná meghozni. Ekkor is döntést kell hoznia, de ekkor mindig ugyan azt a döntést hozza meg, és előfordulhat, hogy beragad egy állapotba, mert a választott döntéssel nem tud kilépni onnan. Például mindig a balra lépést hozza, de balra már nem tud lépni. Ebben segíthet, ha random dönt a következő cselekvésről, és nem valamilyen származtatott információ alapján. Így az ágens nem mindig ugyan azt a cselekvést akarja végrehajtani, ezáltal kikerülhet a végtelen cikluból.