jutalomalakítás

Kapcsolódó fogalmak: 
jutalom
Kapcsolódó fogalmak: 
jutalomfüggvény
Rövid szöveges bemutatás: 
A mesterséges intelligencia kialakítása legtöbbször úgy történik, hogy az egyes rendszereknek egy bizonyos célt kell elérniük. Ehhez a célhoz rendelt jutalom vagy hasznosság igen magas. A valóságban azonban legtöbbször nem a közvetlenül elérhető cselekvések jelentik a célt, hanem a sok elemi lépésből elérhető cselekvéssorozatok. Például ha át akarok menni az úttesten, akkor ahhoz az út másik oldalának irányába kell haladnom, lépnem kell többet is egymás után. A jutalomalakítás ezeket az apró elemi cselekvéseket jutalmazza. Kisebb mértékben mint a tényleges célt, de nem tekinti ezeket semleges cselekvésnek. Fenn áll a veszélye ilyenkor, hogy a rendszer az elemi cselekvések jutalmának maximalizálására törekszik, ami rossz irányba viheti el.