Bellman-frissítés

Kapcsolódó fogalmak: 
Bellman-egyenlet
Kapcsolódó fogalmak: 
értékiteráció
Kapcsolódó fogalmak: 
Markov döntési folyamat (MDF)
Rövid szöveges bemutatás: 
A Bellman-egyenletek megoldására szolgáló iterációs eljárást nevezik Bellman-frissítésnek. Ha n lehetséges állapot van, akkor n Bellman-egyenlet létezik, melyek n ismeretlent tartalmaznak (a keresett állapothasznosságokat). Azonban sajnos a Bellman-egyenletek nemlineárisak a "max" függvény miatt. Így közelítő keresést kell alkalmaznunk. Tehát először kezdeti értéket választunk valamilyen módszerrel, majd kiszámítjuk az egyenletek jobb oldalát, majd az eredményt behelyettesítjük a bal oldalra. Így iterálunk egészen addig amíg egy egyensúlyi helyzetet el nem érünk.