delta (Widrow–Hoff ) szabály

Rövid szöveges bemutatás: 
A Widroff-Hoff szabályt állapotokban nyerhető jutalmak meghatározására alkalmazzuk. Tehát vannak állapotaink és van egy cél állapotunk. Minden egyes állapotban meg tudjuk határozni, az onnan elérhető jósolt jutalom értékét. Azonban ez az érték általában elsőre nem pontos, így meghatározhatjuk ennek az értéknek a hibáját, amit a tényleges és a jósolt jutalom különbségének a fele. A jutalom meghatározására szükségünk van bizonyos paraméterekre. Amikor a Widroff-Hoff szabályt alkalmazzuk, akkor azt fejezzük ki, hogy ezeket a paramétereket merre kell változtatni, hogy a hiba minimális legyen.