13.5. Függetlenség

Bővítsük ki a 13.3. ábrán látható teljes együttes valószínűségi eloszlást egy negyedik, Időjárás változóval. Ezzel a teljes együttes valószínűségi eloszlás P(Fogfájás, Beakadás, Lyuk, Időjárás) lesz 32 bejegyzéssel (mivel az Időjárás változónak négy értéke lehet). A teljes eloszlás a 13.3. ábrán mutatott táblázat négy „példányát” – minden egyes időjárástípusra egyet – fogja magában foglalni. Természetes kérdésnek tűnik, hogy vajon ezeknek a táblázatpéldányoknak mi az egymáshoz és az eredeti háromváltozós táblához való viszonyuk? Hogyan függ össze például a P(fogfájás, beakadás, lyuk, Időjárás = felhős) a P(fogfájás, beakadás, lyuk)-kal?

A megválaszolás egyik lehetséges módja a szorzatszabály alkalmazása:

P(fogfájás, beakadás, lyuk, Időjárás = felhős) = P(Időjárás = felhős|fogfájás, beakadás, lyuk)P(fogfájás, beakadás, lyuk)

Amennyiben eltekintünk az isteni hatalommal bíró páciensektől, nem gondolhatjuk komolyan, hogy valakinek a fogászati problémái befolyásolják az időjárást. Ezért ésszerűnek tűnik a következő kijelentés:

P(Időjárás = felhősfogfájás, beakadás, lyuk) = P(Időjárás = felhős) (13.7)

Ebből a következőre következtethetünk:

P(fogfájás, beakadás, lyuk, Időjárás = felhős) = P(Időjárás = felhős)P(fogfájás, beakadás, lyuk)

Hasonló egyenlet írható fel a P(Fogfájás, Beakadás, Lyuk, Időjárás) eloszlás minden egyes bejegyzéséhez. Az általános egyenletet pedig a következőképpen írhatjuk fel:

P(Fogfájás, Beakadás, Lyuk, Időjárás) = P(Fogfájás, Beakadás, Lyuk)P(Időjárás)

Ebből következően a négyváltozós, 32 elemes táblázat létrehozható egy 8 és egy 4 elemes táblázatból. A dekompozíció sematikus vázlatát a 13.5. (a) ábra mutatja.

Azt a tulajdonságot, ami alapján a (13.7) egyenletet felírtuk függetlenségnek (más szóval marginális függetlenségnek vagy abszolút függetlenségnek) (independence, marginal independence, absolute independence) nevezzük. Esetünkben az időjárás független bárkinek a fogászati problémáitól. Az a és b állítások függetlensége felírható:

P(ab) = P(a) vagy P(ba) = P(b) vagy P(ab) = P(a)P(b) (13.8)

A fenti képletek egymással ekvivalensek (13.7. feladat). Az X és Y változók közötti függetlenség a következőképpen fejezhető ki (még egyszer felhívjuk a figyelmet, hogy ezek ekvivalensek):

P(XY) = P(X) vagy P(YX) = P(Y) vagy P(X, Y) = P(X)P(Y)

A függetlenségi állítások általában a tartománnyal kapcsolatos ismereteken alapulnak. Mint korábban láthattuk, ezek jelentősen lecsökkenthetik a teljes együttes eloszlás meghatározásához szükséges információ mennyiségét. Ha a változók teljes halmaza szétbontható független részhalmazokra, akkor a teljes együttes eloszlás felbontható ezen részhalmazok felett értelmezett, egymástól független együttes eloszlásokra. Például n független pénzfeldobás eredményének együttes eloszlása P(C1, …, Cn) felírható n egyváltozós P(Ci) eloszlás szorzataként. Még kézzelfoghatóbban: a fogászat és a meteorológia függetlensége jó dolog, különben a fogászati gyakorlat mély meteorológiai ismereteket igényelne, és fordítva.

13.5. ábra - Két példa nagyméretű együttes eloszlások kisebb eloszlásokra való felbontására az abszolút függetlenség alapján. (a) Az időjárás és a fogászati problémák függetlenek. (b) A pénzfeldobások függetlenek.
Két példa nagyméretű együttes eloszlások kisebb eloszlásokra való felbontására az abszolút függetlenség alapján. (a) Az időjárás és a fogászati problémák függetlenek. (b) A pénzfeldobások függetlenek.

Amennyiben rendelkezésre állnak, akkor a függetlenségi állítások segíthetnek lecsökkenteni a tartományleírások méretét, valamint a következtetési feladat bonyolultságát. Sajnos azonban a változók teljes halmazait csak nagyon ritkán lehet függetlenség alapján egyértelműen szétválasztani. A függetlenség nem lesz igaz az olyan esetekben, amikor bármilyen, akár indirekt kapcsolat is, de fennáll két változó között. Ezen kívül, a független részhalmazok mérete is lehet egészen nagy – például a fogászat problémaköre egymással összefüggő betegségek tucatjait és tünetek százait takarhatja. Az ilyen típusú problémák kezelésére a függetlenség közvetlen kimondásánál kifinomultabb módszerekre lesz szükségünk.