teljesítménymérték

Kapcsolódó fogalmak: 
ágens
Kapcsolódó fogalmak: 
állapot
Kapcsolódó fogalmak: 
játékelmélet
Kapcsolódó fogalmak: 
Markov-folyamat
Kapcsolódó fogalmak: 
megerősítéses tanulás
Kapcsolódó könyvfejezetek: 
2.2. Jó viselkedés: a racionalitás koncepciója
Rövid szöveges bemutatás: 
A teljesítménymérték határozza meg általánosságban közvetve az ágensek által adott környezetben megoldandó feladatot. Az ágensek célja az, hogy minél inkább megfeleljenek ennek a teljesítménymértéknek, azaz úgy cselekedjenek, úgy változtassák a környezet állapotát, hogy az a legjobb legyen (maximalizálja a teljesítménymértéket). Egy elektronikus kereskedésben résztvevő szoftver ágens esetén például a teljesítménymérték feltehetően egyenesen arányos az ágens által generált anyagi profittal. Egy sakkozó ágens esetén pedig legegyszerűbb esetben 1, ha az ágens nyert, és -1, ha veszített. Ennél valamivel árnyaltabb képet ad, ha azt is figyelembe vesszük, hogy az ágens miként jutott a játszma végére. Például a teljesítménymérték annál nagyobb lehet, minél hamarabb, és minél kevesebb áldozattal tudott nyerni (vesztés esetén pedig díjazható például a hosszas, kitartó, feszített játék, csekély veszteség). Ha az ágens egymaga van a környezetében (azaz nincsenek más ágensek), a környezet determinált, és nem dinamikus, úgy általában igen egyszerű meghatározni, hogy mit kellene tennie az ágensnek ahhoz, hogy egy adott teljesítménymértéket maximalizáljon. Viszont, ha a környezet nem determinisztikus, vagy dinamikus (például azért, mert más ágensek is tevékenykednek benne), úgy a teljesítménymérték maximalizálása már egyáltalán nem triviális feladat. Több ágens esetén a játék-elmélet kínál használható megoldást, nem-determinisztikus esetben a Markov-folyamatok, míg nem teljesen hozzáférhető (kvázi nem-determinisztikus) környezet esetén többek között a megerősítéses tanulás.