22.6. Többértelműség és feloldása

Bizonyos esetekben a hallgatók tudatában vannak egy megnyilatkozás többértelműségének. Íme, néhány példa a napilapok szalagcímeiből:

Squad helps dog bite victim.

Helicopter powered by human flies.

Once-sagging cloth diaper industry saved by full dumps.

Portable toilet bombed; police have nothing to go on.

British left waffles on Falkland Islands.

Teacher strikes idle kids.

Milk drinkers are turning to powder.

Drunk gets nine months in violin case.

(A mondatok fordítását és értelmezését az olvasóra hagyjuk – a ford.)

Fontos

Azonban legtöbb esetben a beszéd, amit hallunk, egyértelműnek tűnik. Ezért amikor a kutatók először kezdtek a nyelv elemzésére számítógépeket használni a hatvanas években, igen meglepődve tapasztalták, hogy majdnem minden megnyilatkozás erősen többértelmű, bár az alternatív értelmezések egy anyanyelvi beszélő számára lehet, hogy nem nyilvánvalók. Egy nagy nyelvtannal és szókinccsel rendelkező rendszer értelmezések ezreit találhatja egy teljesen átlagos mondatra. Vegyük például a „The batter hit the ball” mondatot, amelynek látszólag egy egyértelmű értelmezése van, miszerint a baseballjátékos megüt egy baseball-labdát. De különböző értelmezést kapunk, ha az ezt megelőző mondat ez: „The mad scientist unleashed a tidal wave of cake mix towards the ballroom.” Ez a példa a lexikális többértelműségen (lexical ambiguity) alapszik, amikor egy szónak egynél több jelentése van. A lexikális többértelműség igen gyakori: a „back” lehet határozószó (go back), melléknév (back door), főnév (the back of the room) és ige (back up your files). A „Jack” lehet név, főnév (kártya, hatszögű fém játékdarab, hajózási zászló, hal, hím szamár, dugasz vagy nehéz objektumok emelésére szolgáló eszköz), illetve lehet ige (felemelni egy autót, fénnyel vadászni vagy erősen megütni a baseball-labdát).

A szintaktikai többértelműség (syntactic ambiguity) (avagy strukturális többértelműség (structural ambiguity)) a lexikális többértelműséggel együtt vagy nélküle is előfordulhat. Például az „I smelled a wumpus in 2,2” füzérnek két értelmezése lehet: az egyikben az „in 2,2” prepozíciós kifejezés a főnevet módosítja, a másikban az igét. A szintaktikai többértelműség szemantikai többértelműséghez (semantic ambiguity) vezet, mivel az egyik értelmezés szerint a wumpus a 2,2-n van, a másik szerint a szaga van a 2,2-n. Ebben az esetben a rossz értelmezés halálos tévedés lehet.

A szemantikai többértelműség még olyan kifejezésekben is feltűnhet, ahol nincs lexikális vagy szintaktikai többértelműség. Például a „cat person” főnévi kifejezés takarhat olyasvalakit, aki szereti a macskaféléket, vagy az Attack of the Cat People (A macskaemberek támadása) c. film szalagcímét is. Egy „coast road” lehet olyan út, ami a partvonalat követi, és olyan, amelyik a partra vezet.

Végezetül lehet többértelműség a szó szerinti és az átvitt értelmű jelentések között. A jelképes beszéd fontos a költészetben, de meglepően gyakori a mindennapi beszédben is. A metonímia (metonymy) egy olyan jelképes beszéd, amikor az egyik objektum helyére egy másikat állítunk. Amikor azt halljuk, hogy „Chrysler announced a new model”, nem értelmezzük akként, hogy a cégek beszélni tudnak; inkább azt értjük ezalatt, hogy a céget képviselő szóvivő tette a bejelentést. A metonímia gyakori, és az emberi hallgatók gyakran észrevétlenül interpretálják. Sajnálatos módon a nyelvtanunk abban a formában, ahogy leírtuk, nem ennyire rugalmas. Ahhoz, hogy a metonímia szemantikáját megfelelően kezelni tudjuk, a többértelműség teljesen új szintjét kell bevezetnünk. Ezt úgy tesszük meg, hogy két objektumot használunk a mondat minden kifejezésének szemantikai értelmezésénél: egyet arra az objektumra, amelyre a kifejezés szó szerint vonatkozik (Chrysler), míg egy másikkal utalunk a fogalomcserére (szóvivő). Ezek után meg kell mondanunk, hogy összefüggés van a kettő között. Jelenlegi nyelvtanunkban a „Chrysler announced” értelmezése a következő:

x, e x = ChryslereAnnounce(x) ∧ After(Now, e)

Ezt a következőre kell megváltoztatnunk:

m, x, e x = Chryslere Announce(m) ∧ After(Now, e) ∧ Metonymy(m, x)

E szerint van egy olyan x entitás, amely azonos a Chryslerrel, és van egy másik m entitás, amelyik a bejelentést tette, és a kettő metonímiai relációban áll egymással. A következő lépés annak meghatározása, hogy milyen metonímiarelációk fordulhatnak elő. A legegyszerűbb eset az, amikor nincs semmilyen metonímia – az x szó szerinti objektum és az m metonímiai objektum azonos:

m, x (m = x) ⇒ Metonymy(m, x)

A Chrysler példánál helyénvaló általánosítás az, hogy egy vállalat állhat a szóvivője helyén:

m, x x Organizations Spokesperson(m, x) Metonymy(m, x)

További fogalomcserék lehetnek a szerző a munkákra (I read Shakespeare), vagy általában a létrehozó az alkotásra (I drive a Honda) és a rész az egészre (The Red Sox need a strong arm). A metonímia egyes példái, mint a „The ham sandwich on Table 4 wants another beer” újszerűbbek, és az adott szituációnak megfelelően értelmezik őket.

Az itt vázolt szabályok lehetővé teszik a számunkra, hogy a „Chrysler announced a new model” mondat magyarázatát elkészítsük, de a magyarázat nem logikai következtetés útján jön létre. Valószínűségi vagy nemmonoton következtetést kell használnunk ahhoz, hogy magyarázatjelöltekkel álljunk elő.

Egy metafora (metaphor) olyan jelképes beszéd, amikor egy adott szó szerinti jelentéssel bíró kifejezést használunk egy másik jelentés sugalmazására analógia segítségével. A legtöbb ember úgy gondol a metaforára, mint a költők eszközére, mely nem játszik nagy szerepet a mindennapi szövegekben. Mindazonáltal nagyon sok alapvető metaforát olyan gyakran használunk, hogy még azt sem vesszük észre, hogy azok metaforák. Egy ilyen metafora annak a gondolata, hogy a „több felfelé van”. Ez a metafora lehetővé teszi számunkra annak közlését, hogy az árak emelkedtek, felmásztak vagy rakéta módjára szárnyalnak, hogy a hőmérséklet csökken vagy esik, hogy a bizalom valakiben csökken, illetve hogy egy sztár népszerűsége megugrott vagy szárnyal.

Az ilyen metaforák megközelítésének két módja lehetséges. Az egyik az, hogy a metafora teljes tudását beépítjük a szótárba – új jelentéseket adunk az emelkedik, esik, mászik stb. szavakhoz, melyek úgy írják le őket, hogy mindenféle mértékre vonatkozhatnak, nem csak a magasságra. Ez a módszer sok alkalmazás számára elegendő, de nem ragadja meg a metafora azon generálóképességét, amely az emberek számára lehetővé teszi új kifejezések használatát – mint például az „alábukik” vagy a „kirobbantja a tetőt” – anélkül hogy félreértéstől tartanának. A másik módszer a gyakori metaforákról explicit tudást illeszt be a rendszerbe, és ezeket használja az új kifejezések olvasás közbeni megértéséhez. Például tegyük fel, hogy egy rendszer ismeri a „több felfelé van” metaforáját. Azaz tudja, hogy az olyan logikai kifejezések, melyek egy függőleges skálán értelmezett pontra vonatkoznak, értelmezhetők egy mennyiségi skála megfelelő pontjaira vonatkozóként. Ezek után az „eladások magasak” kifejezéshez tartozna egy Altitude(Sales, High) szó szerinti értelmezés, amit metafora segítségével Quantity(Sales, Much)-ként értelmezhetünk.

22.6.1. A többértelműség feloldása

Fontos

Ahogy korábban mondtuk, a többértelműség feloldása diagnózis kérdése. A beszélő szándéka a kommunikációra a megnyilatkozásban szereplő szavak nem megfigyelt oka, és a hallgató dolga, hogy a szavakból és a szituációról való tudásából kiindulva visszafelé előállítsa a beszélő legvalószínűbb szándékát. Más szavakkal, a hallgató a következőt oldja meg:

ahol a Likelihood lehet valószínűség vagy a preferenciák bármilyen számszerű mértéke. Valamilyen preferenciára szükség van, mivel a szintaktikai és szemantikai értelmezési szabályok önmagukban nem tudnak a kifejezéshez vagy mondathoz egyetlen helyes értelmezést meghatározni. Ezért részekre bontjuk a munkát: a szintaktikai és szemantikai értelmezés felelős a lehetséges értelmezések halmazának előállításáért, a többértelműség feloldásának folyamata pedig kiválasztja a legjobbat.

Vegyük észre, hogy a szólásaktus szándékáról, és nem csak a beszélő által kimondott aktuális kijelentésről beszélünk. Például ha azt halljuk egy politikustól, hogy „I am not a crook”, akkor lehet, hogy csak 50% valószínűséget adunk annak, hogy a politikus nem bűnöző, ugyanakkor 99,999%-ot annak, hogy a beszélő nem egy kampós pásztorbot (a crook másik jelentése – a ford.). Mégis nagyobb valószínűséget rendelünk ahhoz az értelmezéshez, hogy

Assert(Speaker, ¬(Speaker Criminals)

mivel ez a valószínűbb dolog, amit mond.

Vizsgáljuk ismét az „I smelled a wumpus in 2,2.” többértelmű példát! Egy preferenciaheurisztika a jobbra asszociáció (right association), amely szerint amikor el kell döntenünk, hogy az „in 2,2” PP-t hova helyezzük el az elemzési fában, akkor azt preferáljuk, hogy a jobb szélen elhelyezkedő összetevőhöz csatoljuk, ami jelen esetben az „a wumpus” NP. Természetesen ez csak egy heurisztika; az „I smelled a wumpus with my nose” mondatra a heurisztikát felülbírálná az a tény, hogy az „a wumpus with my nose” NP nem valószínű.

A többértelműség feloldása a tények kombinálásával oldható meg, felhasználva a könyvben eddig látott tudásábrázolásra és bizonytalanság melletti következtetésre alkalmas minden technikát.

A tudást négy modellre bonthatjuk:

  1. A világ modell (world model): annak valószínűsége, hogy egy állítás előfordul a világban.

  2. A mentális modell (mental model): annak valószínűsége, hogy a beszélő létrehozza azt a szándékát, hogy egy adott tényt a hallgatóval közöljön, feltéve, hogy az bekövetkezik. Ez annak modelljét kombinálja, amit a beszélő hisz azzal, amit a beszélő hisz arról, amit a hallgató hisz és így tovább.

  3. A nyelvi modell (language model): annak valószínűsége, hogy szavak egy bizonyos füzére lesz kiválasztva, azt feltételezve, hogy a beszélőben létezik egy adott tény elmondásának szándéka. A fejezetben ismertetett CFG- és DCG-modellek a valószínűségre logikai (igaz/hamis) modellt használnak: egy füzérnek vagy lehet egy adott értelmezése, vagy nem. A következő fejezetben a CFG olyan valószínűségi változatát látjuk majd, amely a többértelműség feloldására egy jobban informált nyelvi modellt készít.

  4. Az akusztikai modell (acoustic model): annak valószínűsége, hogy hangok egy adott sorozata keletkezik azt feltéve, hogy a beszélő szavak egy adott sorozatát választotta. A beszédfelismerést a 15.6. alfejezet tárgyalta.