16.8. Összefoglalás

Ez a fejezet megmutatta, hogy hogyan kombinálhatjuk össze a hasznosságelméletet a valószínűségekkel, lehetővé téve az ágensnek olyan cselekvések kiválasztását, amelyek maximalizálni fogják a várható teljesítményét.

  • A valószínűség-elmélet (probability theory) előírja, hogy az ágens a tényei alapján milyen hiedelmekkel rendelkezzen, a hasznosságelmélet (utility theory) azt írja elő, hogy az ágens mit akar, a döntéselmélet (decision theory) pedig összeilleszti a kettőt, és előírja, hogy az ágens mit tegyen.

  • A döntéselmélet felhasználásával építhetünk egy olyan rendszert, ami a döntések meghozatalakor figyelembe veszi az összes lehetséges cselekvést, és azt választja ki, ami a legjobb várható kimenetelt adja. Egy ilyen rendszert racionális ágensnek (rational agent) nevezhetünk.

  • A hasznosságelmélet megmutatja, hogy az ágens, amelynek szerencsejátékok közötti preferenciái eleget tesznek bizonyos egyszerű axiómáknak, leírható egy hasznosságfüggvénnyel; továbbá az ágens a cselekvéseit úgy választja meg, mintha a várható hasznosságát maximalizálná.

  • A többattribútumú hasznosságelmélet (multiattribute utility theory) olyan hasznosságokkal foglalkozik, amelyek az állapotok több, különböző attribútumától függnek. A sztochasztikus dominancia (stochastic dominance) egy különösen hasznos technika egyértelmű döntések meghozatalára még az attribútumok pontos hasznosságértékei nélkül is.

  • A döntési hálók (decision networks) egy egyszerű formalizmust biztosítanak a döntési problémák leírására és megoldására. Ezek a valószínűségi hálók magától értetődő kiterjesztései döntési és hasznossági csomópontokkal a véletlen csomópontokon túl.

  • Bizonyos esetekben a probléma megoldásához hozzátartozik a többletinformáció megszerzése a döntés meghozatala előtt. Az információ értékét (value of information) úgy definiáljuk, mint a várható hasznosság javulását az információ nélküli helyzethez hasonlítva.

  • Azok a szakértő rendszerek (expert systems), amelyek hasznosságinformációkat is tartalmaznak, többletképességgel rendelkeznek a tisztán következtető rendszerekhez képest. Azon túl, hogy döntéseket tudnak hozni, dönthetnek az információ megszerzéséről annak értéke alapján, és kiszámíthatják döntéseiknek a valószínűségek és hasznosságok kis megváltozására vonatkozó érzékenységét.

16.8.1. Irodalmi és történeti megjegyzések

A maximális várható hasznosság elvének az egyik legkorábbi, bár végtelen hasznosságokat is tartalmazó szokatlan alkalmazása Pascal fogadása volt, melyet először mint a Port-Royal Logic egy részét Arnauld közölt (Arnauld, 1662). Daniel Bernoulli volt az első, a szentpétervári paradoxont vizsgálva, aki felismerte a szerencsejátékokra vonatkozó preferenciák felmérésének a fontosságát, megállapítva, hogy „egy dolog értékét nem az árának kell meghatároznia, hanem a hasznosságának, amit eredményez” (Daniel Bernoulli, 1738, eredeti kiemelés). Jeremy Bentham javasolta a hedonisztikus kalkulust (hedonistic calculus) az „örömök” és „bánatok” összehasonlítására, amellett érvelve, hogy minden döntésnek (nem csak a pénzügyieknek) redukálhatónak kell lennie hasznosságok összehasonlítására (Bentham, 1823).

A numerikus hasznosságok származtatása a preferenciákból Ramseynél jelent meg először (Ramsey, 1931); a jelenlegi szövegben a preferenciákra megadott axiómák megfogalmazásukban közelebb állnak azokhoz az axiómákhoz, amelyek egy újrafelfedezés során a Theory of Games and Economic Behaviorben (Neumann és Morgenstern, 1944) jelentek meg. Ezeknek az axiómáknak kiváló bemutatását adja Howard a kockázatpreferenciák tárgyalása során (Howard, 1977). Ramsey szubjektív valószínűségeket (nem pontosan hasznosságokat) vezetett le az ágens preferenciáiból; mostanában Savage és Jeffrey vitt végbe hasonló konstrukciót (Savage, 1954; Jeffrey, 1983). Von Winterfeldt és Edwards modernebb szempontból ismerteti a döntéselemzést és annak az emberi preferenciastruktúrákkal való kapcsolatát (Von Winterfeldt és Edwards, 1986). A mikrohalál hasznosságmértéket Howard elemzi (Howard, 1989). Az Economist egy 1994-es felmérése egy emberi élet értékét 750 000 és 2,6 millió dollár közzé teszi. Azonban Richard Thaler irracionális variánsokat talált arra nézve, hogy mennyit hajlandó valaki fizetni, hogy elkerüljön egy halálos kockázatot, ahhoz képest, hogy mennyiért hajlandó felvállalni ugyanazt a kockázatot. 1/1000 esély esetén a válaszadó maximum 200 dollárt fizetne, hogy elkerülje a kockázatot, míg 50,000 dollárért sem hajlandó felvállalni ezt a kockázatot (Thaler, 1992).

A QALY-t sokkal szélesebb körben használták orvosi és társadalmi döntések meghozatalánál, mint a mikrohalált, lásd (Russell, 1990), ami jellemző példája azoknak az érveléseknek, hogy a QALY-t használó várható hasznosság növekedésének alapján a közegészségügyben alapos változtatásokra van szükség.

A Decisions with Multiple Objectives: Preferences and Value Tradeoffs (Keeney és Raiffa, 1976) c. könyv részletes bevezetést ad a többattribútumú hasznosságelméletbe. Ez olyan módszerek korai számítógépes megvalósítását írja le, amelyekkel a többattribútumú hasznosságfüggvényhez a szükséges paraméterek kikérdezhetők, és hosszasan tárgyalja az elmélet valós alkalmazásait. Az MI-n belül a legelső hivatkozás az MVH elvre Wellman cikke volt (Wellman, 1985), amely egy URP-nek (Utility Reasoning Package) nevezett rendszert tartalmaz, ami képes kezelni a preferenciák függetlenségéről és feltételes függetlenségéről szóló állításokat, hogy elemezze a döntési probléma struktúráját. A sztochasztikus dominanciát a kvalitatív valószínűségi modellel Wellman vizsgálta alaposan (Wellman, 1988; 1990a). Wellman és Doyle egy előzetes vázlatát adja annak, hogy hogyan lehet felhasználni hasznosság-függetlenség relációk komplex halmazát a hasznosságfüggvény strukturált modelljének megalkotásához, hasonlóan ahhoz, ahogyan a valószínűségi háló az együttes valószínűségeloszlás-függvény strukturált modelljét adja (Wellman és Doyle, 1992). Bacchus és Grove, valamint La Mura és Shoham további eredményeket közöl ezzel kapcsolatban (Bacchus és Grove, 1995; 1996; La Mura és Shoham, 1999).

A döntéselmélet már az 1950-es évek óta szabványos eszköz a közgazdaságtanban, a pénzügyben és a menedzsment tudományban. Az 1980-as évekig az egyszerű döntési szituációk reprezentálására a döntési fák voltak a fő eszközök. A döntési hálókat vagy hatásdiagramokat Howard és Matheson vezette be (Howard és Matheson, 1984), bár a szükséges fogalmakat már korábban kifejlesztette egy csoport (benne Howard és Matheson) az SRI-nél (Miller és társai, 1976). Howard és Matheson eljárása azonban egy közbenső lépést, a döntési hálónak egy döntési fára történő átírását tartalmazta, ahol általános esetben a fa exponenciális méretű volt. Shachter kifejlesztett egy eljárást, ami közvetlenül a döntési hálókon alapult anélkül, hogy egy közbeeső döntési fát hozna létre (Shachter, 1986). Ez az algoritmus volt az első, amely teljes következtetést tudott elvégezni többszörösen összekötött Bayes-hálókban. Egy mostani munkában Nilsson és Lauritzen összekapcsolta a döntési hálókhoz tartozó algoritmusokat a Bayes-hálóknál kifejlesztett klaszterezési algoritmusokkal (Nilsson és Lauritzen, 2000). Oliver és Smith gyűjteménye számos hasznos cikket tartalmaz a döntési hálókról, mint ahogy a Networks folyóirat 1990-es különkiadása is hasznos cikkekből áll (Oliver és Smith, 1990). Döntési hálókról és hasznosságmodellezésről szóló cikkek a Management Science-ben is rendszeresen megjelennek.

Az információérték-elméletet Ron Howard elemezte először (Howard, 1966). Ez a cikke a következő megjegyzéssel ér véget: „Ha az információérték-elmélet és a hozzá kapcsolódó döntéselméleti struktúrák a jövőben nem képezik igen nagy részét a mérnökök képzésének, akkor a mérnöki szakma azt fogja látni, hogy hagyományos szerepét, a tudományos és közgazdasági erőforrásoknak az emberiség előnyére történő kezelését, egy másik szakma elorozta.” A hivatkozott forradalom a vezetési módszerekben a mai napig nem következett be, bár ez változhat amint az információérték-elmélet felhasználása a bayesi szakértő rendszerekben elterjedtebbé válik.

Az orvosi döntéseknél történő korai alkalmazásoktól eltekintve meglepően kevés MI-kutató alkalmazta a 13. fejezetben tárgyalt döntéselméleti eszközöket. A kevés kivételek egyike Jerry Feldman volt, aki a döntéselméletet a látás problémájára (Feldman és Yakimovsky, 1974) és a tervkészítés problémájára (Feldman és Sproull, 1977) alkalmazta. Az 1980-as években aztán hirtelen újra megnőtt az érdeklődés az MI részéről a valószínűségi módszerek iránt, a döntéselméleti szakértő rendszerek széles körben elterjedtekké váltak (Horvitz és társai, 1988) – valójában 1991-től még az Artificial Intelligence fedőlapja is egy döntési hálót ábrázolt, bár élve művészi szabadságukkal egyes nyilak irányát megváltoztatták.

16.8.2. Feladatok

16.1.

(David Heckerman alapján, de a magyar kiadású Guinness Rekordok Könyvére alapozva [Guinness Rekordok Könyve 1991, Solaris Kft., Budapest].) Ez a feladat az Almanac Game-hez kapcsolódik, amit döntéselemzők használnak a numerikus becslések kalibrálására. Adjon becslést az alábbi problémákra, azaz azt a számot adja meg, amiről úgy gondolja, hogy ugyanolyan valószínűséggel lehet túl nagy is, mint túl kicsi. Próbálja meg eltalálni a 25 percentilises becslést is, azaz azt a számot, amiről úgy gondolja, hogy 25% esélye van, hogy túl nagy lesz, és 75% esélye, hogy túl kicsi. Ugyanígy tippelje meg a 75 percentilisest is. (Így minden egyes kérdésre három becslést kell megadnia összesen – egy kisebbet, a mediánt és egy nagyobb értéket.)

  1. Melyik évben születtek meg az első (névadó) sziámi ikrek?

  2. Hány helyi értékig képes valaki emlékezetből visszaidézni a π számot?

  3. Hány rák volt az eddig megfigyelt legnagyobb krill rajban?

  4. A kőkorszak óta – a háborúktól és a katasztrófáktól eltekintve – az elhalálozások hány százalékáért felelős a maláriaszúnyog?

  5. Az állatkertekben végzett mérések szerint egy kifejlett csimpánz hányszor erősebb egy átlagos normális férfinál?

  6. Az eddigi legmagasabb felállított karácsonyfa magassága?

  7. Milyen hosszú a Csendes-óceánt átszelő legrövidebb hajóút hossza?

  8. A Föld átlagos sűrűsége hányszorosa a vízének?

  9. Egy évben átlagosan hány esetben észlelnek szeizmikus tevékenységet, ebből mennyi érezheto, és mennyi okoz kárt?

  10. Milyen magas a hőmérséklet a Holdon a legjobban napsütötte helyen (Egyenlítőre merőlegesen)?

A helyes válaszok a fejezet utolsó feladata után találhatók meg. A döntéselemzés szempontjából nem az az érdekes, hogy az ön mediántippjei milyen közel vannak a valódi válaszokhoz, hanem inkább az, hogy milyen gyakran van a valódi érték az ön által tippelt 25%-os és 75%-os határ között. Ha ez az esetek felénél így van, akkor a határai pontosak. De ha ön az emberek többségéhez hasonló, akkor a kelleténél magabiztosabb, és az esetek felénél kevesebbszer lesz az igazi érték az ön által tippelt határokon belül. Ezen gyakorlással „javíthat”, és így hasznosabb információt nyújthat a döntéshozáshoz. Próbálja ki ezt a második kérdéssort, hogy lássa, bekövetkezett-e valamilyen javulás:

  1. Becslések szerint Picasso hány képet, illetve vázlatot festett az élete során?

  2. Hány statiszta szerepel Sir Richard Attenborough Ghandi c., 1982-ben készült filmjének temetési jelenetében?

  3. Milyen magas a világ legmagasabb építménye (varsói rádiótorony)?

  4. Milyen hosszú a transzszibériai vasútpálya?

  5. Hány utas fordult meg az O’Hara chicagói repülőtéren 1988-ban?

  6. A világ leglassabban mozgó mechanikus szerkezete (óra) hány év alatt tesz meg egy fordulatot?

  7. A dobozos sör piacra dobásának éve?

  8. A világ legnagyobb „tojásgyárában”, a Croton Egg Farmon Amerikában a cég tyúkjai hány tojást tojnak naponta?

  9. Milyen volt a népsűrűség 1968-ban Macaó portugál tartományban, a világ legsűrűbben lakott helyén?

  10. A Man-szigeten ülésezik a megszakítás nélkül leghosszabb ideje fennálló törvényhozás. Az idén hány éves?

  11. Mikor helyezték üzembe az első forgalomirányító jelzőlámpákat (Londonban)?

  12. Mikor alakult a Nemzetközi Labdarúgó Szövetség (a FIFA)?

16.2.

Az állami szerencsejáték 1 dollárba kerül. Két lehetséges díj van: 10 dollár 1/50 valószínűséggel és 1 000 000 dollár 1/2 000 000 valószínűséggel. Mennyi a szerencsejátékjegy várható pénzügyi értéke? Mikor racionális (ha van ilyen helyzet egyáltalán) jegyet vásárolni? Pontosabban – mutassa ezt be egy hasznosságokat tartalmazó egyenlettel. Azt feltételezheti, hogy U(10 dollár) = 10 × U(1 dollár), de U(1 000 000 dollár)-ra hasonlót nem lehet feltételezni. Szociológiai tanulmányok mutatják, hogy az alacsonyabb jövedelmű emberek aránytalan számú sorsjegyet vásárolnak. Mit gondol, ez azért van, mert rosszabb döntéshozók, vagy mert eltérő hasznosságfüggvényük van?

16.3.

J. Bernoulli 1738-ban vizsgálta a szentpétervári paradoxont, ami a következő. Lehetősége nyílik részt venni egy szerencsejátékban, amelyben egy szabályos érmét dobnak fel ismételten az első fej előfordulásáig. Ha az első fej az n-edik dobásnál következik be, akkor a nyereménye 2n dollár.

  1. Mutassa meg, hogy ennek a játéknak a várható pénzügyi értéke végtelen.

  2. Mennyit fizetne ön, személy szerint a részvételért?

  3. Ezt a nyilvánvaló paradoxont Bernoulli azzal a javaslattal oldotta meg, hogy a pénz hasznossága logaritmikus skálát követ (azaz U(Sn) = a + log2n + b, ahol Sn azt az állapotot jelöli, hogy n dollárunk van). Mi a játék várható hasznossága ezzel a feltevéssel?

  4. Mi az a maximum összeg, amit racionális lenne kifizetni a részvételért, feltéve, hogy a kezdeti vagyona k dollár?

16.4.

Becsülje meg a saját hasznosságfüggvényét különböző pénznövekményekre. Ezt úgy teheti meg, hogy egy sor preferenciatesztet futtat egy meghatározott M1 összeg és egy [p, M2; (1 – p), 0] szerencsejáték között. Válasszon különböző M1 és M2 értékeket, és változassa addig p-t, ameddig nem lesz ön számára közömbös, hogy melyiket választja a kettő közül. Ábrázolja a hasznosságfüggvényt.

16.5.

Írjon számítógépes programot, ami automatizálja a 16.4. feladat folyamatát. Próbálja ki a programot különböző hátterű és politikai irányultságú embereken. Elemezze eredményei konzisztenciáját az összes személy esetén és egyetlen személy esetén is.

16.6.

Mennyit ér egy mikrohalál önnek? Fejlesszen ki protokollt ennek meghatározására. Fogalmazzon meg kérdéseket abból a szempontból, hogy mennyit ér a kockázat elkerülése, és abból a szempontból is, hogy mennyiért vállalja a kockázatot.

16.7.

Mutassa meg, hogyha X1 és X2 preferenciálisan független X3-tól, és X3 és X2 preferenciálisan független X1-től, akkor szükségszerűen X1 és X3 is preferenciálisan független X2-től.

16.8.

Ez a feladat a 16.5. ábrán bemutatott repülőtéri elhelyezési probléma elemzését fejezi be.

  1. Adjon meg ésszerű, a témakörhöz kapcsolódó változókat, valószínűségeket és hasznosságokat a háló számára, feltételezve, hogy három helyszín van.

  2. Oldja meg a döntési problémát.

  3. Mi történik, ha a műszaki fejlődés következtében a repülőgépek csak fele akkora zajt okoznak?

  4. És ha a zaj elkerülése háromszor fontosabbá válik?

  5. Számolja ki a TIÉ mennyiséget a LégiForgalom, a Pereskedés és az Építkezés esetén a modellben.

16.9.

Ismételje meg a 16.8. feladatot, felhasználva a 16.6. ábrán látható cselekvéshasznosság-reprezentációt.

16.10.

Melyik feltételes valószínűségi tábla bejegyzésre a legérzékenyebb a hasznosság a 16.8. és a 16.9. feladatban konstruált repülőtéri elhelyezési diagramok esetén, ha az elérhető tényeket ismerjük.

16.11.

(Judea Pearltől átvett feladat [Pearl, 1988].) Egy használt autót vásárló eltérő költségek mellett különböző teszteket végeztethet (például megrugdossa a gumikat, autószerelőhöz viszi a kocsit), majd a tesztek eredménye alapján eldönti, hogy melyik autót vegye meg. Feltételezzük, hogy a vásárló akkor veszi meg a c1 autót, ha elég idő van legalább egy teszt elvégzésére, továbbá, hogy c1-nek t1 a tesztje, és ez 50 dollárba kerül.

A kocsi jó állapotban (q+ minőség) vagy rossz állapotban (q– minőség) lehet, és a tesztek segíthetnek a kocsi állapotának meghatározásában. A c1 kocsi 1500 dollárba kerül, piaci értéke azonban 2000 dollár, ha jó állapotban van; ha nem, akkor 700 dollár szükséges a jó állapotba hozásához. A vásárló úgy becsüli, hogy 70% esélye van, hogy a kocsi jó állapotban van.

  1. Rajzolja fel a döntési hálót, ami ezt a problémát reprezentálja.

  2. Számítsa ki a várható nettó nyereséget c1 megvásárlása esetén, ha nincsenek tesztek.

  3. A tesztek azzal a valószínűséggel jellemezhetők, hogy a kocsi átmegy-e a teszten vagy elbukik, attól függően, hogy jó vagy rossz állapotban van. A következő információkkal rendelkezünk:

P(Átmegy(c1, t1)|q+(c1)) = 0,8

P(Átmegy(c1, t1)|q(c1)) = 0,35

Felhasználva a Bayes-tételt, számítsa ki annak valószínűségét, hogy a kocsi átmegy (vagy elbukik) a teszten, és így azt a valószínűséget, hogy jó vagy rossz állapotban van adott tesztkimenetel esetén.

  1. Számítsa ki az optimális döntést, ha átmegy, illetve ha elbukik, és számítsa ki a várható hasznosságukat.

  2. Számítsa ki a teszt információértékét, és vezesse le a vásárló optimális tervét.

16.12.

Bizonyítsa be, hogy az információ értéke nem negatív és sorrendfüggetlen, amint azt a 16.6. alfejezetben állítottuk. Magyarázza el, hogyan lehetséges, hogy valaki rosszabb döntést hoz az információ megkapása után, mint amit a megkapása előtt hozott volna.

16.13.

Módosítsa és egészítse ki a Bayes-hálós kódot a kódtárban, hogy képes legyen döntési hálókat létrehozni és kiértékelni, illetve kiszámítani az információ értékét.

A 16.1. feladat válaszai: Első sorozat: 1811, 40 ezer, 10 millió, 50%, 5-6, 67,36 m, 17 550 km, 5,515, 500 000, 100 000, 1000, 117,2 °C. Második sorozat: 13 500, 300 000, 646,28 m, 9438 km, 56 281 000, 25 753, 1935, 3,7 millió, 28 343 fő/km2, 1020, 1868, 1904.