14.1. A tudás reprezentálása bizonytalanság esetén

A 13. fejezetben láttuk, hogy az együttes valószínűség-eloszlás függvény alapján minden kérdés megválaszolható a modellezett tárgytartománnyal kapcsolatban, de a változók számának növekedésével ez általában kivitelezhetetlenné válik. Továbbá az elemi események valószínűségének megadása is igen mesterkélt és nehéz is lehet, hacsak nem áll rendelkezésre nagy mennyiségű adat a valószínűségek statisztikai becsléséhez.

A változók közötti függetlenségi és feltételes függetlenségi relációkkal kapcsolatban azt is láttuk, hogy ezek nagyban csökkenthetik az együttes valószínűség-eloszlás függvény megadásához szükséges valószínűségek számát. Ez a fejezet bevezet egy Bayes-hálónak (Bayesian network[143]) nevezett adatstruktúrát a változók közötti függőség leírásához, és bármely együttes valószínűség-eloszlás függvény tömör megadásához.

A Bayes-háló egy irányított gráf, amelyben minden csomóponthoz számszerű valószínűségi információk vannak csatolva. A teljes megadás a következő:

  1. A háló csomópontjait valószínűségi változók egy halmaza alkotja. A változók lehetnek diszkrétek vagy folytonosak.

  2. Irányított élek (nyilak) egy halmaza összeköt bizonyos csomópontpárokat. Ha létezik nyíl az X csomóponttól az Y csomópontig, azt mondjuk, hogy az X a szülője az Y-nak.

  3. Minden Xi csomóponthoz tartozik egy P(XiSzülők(Xi)) feltételes valószínűség-eloszlás, ami számszerűen megadja a szülők hatását a csomóponti változóra.

  4. A gráf nem tartalmaz irányított kört (azaz irányított, körmentes gráf – Directed, Acyclic Graph, DAG).

A háló topológiája – a csomópontok és élek halmaza – megadja a tárgyterületen fennálló feltételes függetlenségi kapcsolatokat, hogy mily módon, azt hamarosan pontosan kifejtjük. Egy helyesen létrehozott hálóban az X csomópontot az Y csomóponttal összekötő nyíl intuitív jelentése rendszerint az, hogy az X-nek közvetlen befolyása van az Y-ra. A tárgyterület szakértője számára általában könnyű eldönteni, hogy milyen közvetlen befolyások teljesülnek egy adott területen – valójában sokkal könnyebb, mint a megfelelő valószínűségeket megadni. Ha pedig a Bayes-háló topológiája kész, már csak az egyes változókhoz tartozó feltételes valószínűség-eloszlásokat kell meghatározni a szülőkkel mint feltételekkel. Látni fogjuk, hogy a topológia és a feltételes eloszlások együttese elegendő, hogy megadja (implicit módon) az összes változó feletti együttes valószínűség-eloszlás függvényt.

Idézzük fel a 13. fejezetben leírt egyszerű világot, amely a Fogfájás, a Lyuk, a Beakadás és az Időjárás változót tartalmazza. Úgy érveltünk, hogy az Időjárás független az összes többi változótól; továbbá, hogy a Fogfájás és a Beakadás feltételesen függetlenek a Lyuk ismeretében. Ezeket a viszonyokat a 14.1. ábrán bemutatott Bayes-háló reprezentálja. Formálisan, a Fogfájás és a Beakadás feltételes függetlenségét a Lyuk ismeretében a Fogfájás és a Beakadás közötti nyíl hiánya jelzi. Szemléletesen, a háló azt a tényt fejezi ki, hogy a Lyuk közvetlen oka a Fogfájás-nak és a Beakadás-nak, további közvetlen okozati kapcsolat azonban nem létezik a Fogfájás és a Beakadás között.

14.1. ábra - Egy egyszerű Bayes-háló, amelyben az Időjárás független a többi három változótól, a Fogfájás és a Beakadás pedig feltételesen függetlenek a Lyuk ismeretében
Egy egyszerű Bayes-háló, amelyben az Időjárás független a többi három változótól, a Fogfájás és a Beakadás pedig feltételesen függetlenek a Lyuk ismeretében

Most vizsgáljuk meg a közvetkező példát, ami csak egy árnyalatnyival öszetettebb. Otthonunkban egy új betörésjelzőt szereltek fel. Ez megbízhatóan észleli a betöréseket, de időnként kisebb földrengések esetén is jelez. (Ez a példa Judea Pearltől származik, aki Los Angeles-i lakos; innen ered a földrengések iránti különös érdeklődése.)[144] Két szomszédunk is van, János és Mária, akik megígérték, hogy felhívnak a munkahelyünkön, ha meghallják a riasztónkat. János mindig felhív minket, ha meghallja a riasztást, de néha összekeveri a telefoncsörgést a riasztó csengésével, és ekkor is telefonál. Mária viszont, mivel szereti hangosan hallgatni a zenét, néha meg sem hallja a riasztót. Mi tehát a hívások bekövetkezte vagy hiánya alapján szeretnénk megbecsülni a betörés valószínűségét. Ezt az egyszerű problémát a 14.2. ábrán látható Bayes-háló írja le.

14.2. ábra - Egy tipikus Bayes-háló, amely a topológiát és a feltételes valószínűségi táblákat (FVT) is mutatja. Az FVT-kben B, F, R, J és M szerepel Betörés, Földrengés, Riasztás, JánosTelefonál és MáriaTelefonál helyett.
Egy tipikus Bayes-háló, amely a topológiát és a feltételes valószínűségi táblákat (FVT) is mutatja. Az FVT-kben B, F, R, J és M szerepel Betörés, Földrengés, Riasztás, JánosTelefonál és MáriaTelefonál helyett.

Egyelőre hagyjuk figyelmen kívül az ábrán szereplő feltételes eloszlásokat, és összpontosítsunk a háló topológiájára. A betörés háló esetén a topológia azt mutatja, hogy a betörés és a földrengés közvetlenül befolyásolja a riasztó megszólalásának valószínűségét, ellenben János vagy Mária hívásának bekövetkezése csak magán a riasztón múlik. A háló így tartalmazza azon feltevéseinket, hogy ők közvetlenül nem vesznek észre betöréseket, nem vesznek észre kisebb földrengéseket, és nem egyeztetnek hívás előtt.

Megfigyelhető, hogy a hálóban nincsenek olyan csomópontok, amelyek azt írnák le, hogy Mária éppen hangos zenét hallgat, vagy hogy a telefon cseng, és megzavarja Jánost. Ezeket a tényezőket a Riasztás csomóponttól a JánosTelefonál és MáriaTelefonál csomópontig tartó élekhez rendelt bizonytalanság foglalja magában. Ebben mind a lustaság, mind pedig a tudatlanság tetten érhető: rengeteg munka volna olyan tényezők meghatározása, amelyek valószínűbbé vagy kevésbé valószínűvé válnának adott esetekben, és nincs semmilyen ésszerű módszerünk, hogy ezekre vonatkozóan érdemi információt szerezzünk. A valószínűségek valójában a lehetséges körülmények egy potenciálisan végtelen halmazát összegzik, amikor is a riasztó elmulaszt megszólalni (magas páratartalom, elektromos hálózat hibája, lemerült elem, elvágott drót, döglött egér beragadva a csengőbe…), vagy, hogy János és Mária elmulaszt értesíteni minket (ebédelni mentek, szabadságon vannak, időlegesen megsüketültek, egy áthaladó helikopter…). Ezen a módon egy kis ágens is képes megbirkózni egy igen bonyolult világgal, legalábbis közelítőleg. A közelítés mértéke tetszőlegesen javítható további releváns információk bevezetésével.

Most folytassuk a 14.2. ábrán mutatott feltételes eloszlásokkal. Az ábrán minden eloszlás mint feltételes valószínűségi táblázatFVT (conditional probability table, CPT) van feltüntetve. (A táblázatos formát diszkrét változók esetén lehet használni; más reprezentációkat, amelyek már folytonos változóknál is használhatók, a 14.2. alfejezetben írunk le.) Az FVT-táblázatban minden sor az egyes csomóponti értékek feltételes valószínűségét tartalmazza az adott sorhoz tartozó szülői feltétel (conditioning case) esetén. A szülői feltétel a szülő csomópontok értékeinek egy lehetséges kombinációja (egyfajta elemi esemény, ha úgy tetszik). Az egyes sorokban szereplő számok összegének 1-et kell adnia, mivel az adott változó összes lehetséges értéke szerepel a bejegyzésekben. Bináris változók esetén, ha ismerjük, hogy az igaz érték valószínűsége p, a hamis érték valószínűségének 1 – p-nek kell lennie, így gyakran a második számot elhagyjuk, ahogyan ezt a 14.2. ábrán is tettük. Általánosabban, egy k bináris szülővel rendelkező bináris változó esetén 2kvalószínűség adható meg tetszés szerint. Szülő nélküli csomópontok esetén a táblázat csak egyetlen sort tartalmaz, a változó egyes értékeinek a priori valószínűségeit.



[143] Az angol nyelvű szakirodalomban a Bayes-háló a legelterjedtebb megnevezés, de számos más is létezik: bizonyosságháló (belief network), valószínűségi háló (probabilistic network), okozati háló (causal network), tudásháló (knowledge map). A statisztikában a gráfos modell (graphical model) bővebb modellosztályt jelent, ami a Bayes-hálót is magában foglalja. A Bayes-hálók egy kiterjesztésének neve a döntési háló (decision network) vagy hatásdiagram (influence diagram) – lásd 16. fejezet.

[144] Judea Pearl meghatározó szerepet játszott a Bayes-hálók egzakt matematikai hátterének és gyakorlati alkalmazhatóságának a vizsgálatában. (A ford.)