22.2. formális nyelvtan az angol nyelv egy töredékére

Ebben a fejezetben definiálunk egy nyelvtant az angol nyelv egy kis töredékére, ami megfelelő a wumpus világról szóló kijelentésekhez. Ezt a nyelvet ℰ0-nak nevezzük. A későbbi részek javítani fognak az ℰ0-n, hogy valamelyest jobban hasonlítson a beszélt angolra. Igen valószínűtlen, hogy valaha is megszerkesztjük az angol nyelv teljes nyelvtanát, már csak azért sem, mivel nincs két ember, aki teljesen megegyezne abban, mit is tekint érvényes angolnak.

22.2.1. Az ℰ0 szókincse

Először definiáljuk a szókincset (lexicon), azaz a megengedett szavak listáját. A szavakat a szótárhasználók számára ismerős módon csoportosítjuk kategóriákba, avagy beszédrészekbe: főnevek, névmások és nevek dolgok elnevezésére, igék események jelölésére, jelzők a főnevek módosítására és határozószók az igék módosítására. Egyes olvasók számára kevéssé ismertek lehetnek a következő kategóriák: névelők (articles) (például a the), elöljárószavak (prepositions) (például in) és kötőszók (conjunctions) (például and). A 22.3. ábra mutat egy kis szókincset.

Minden egyes kategória …-tal végződik annak jelzésére, hogy vannak más szavak is a kategóriában. Azt is meg kell jegyeznünk azonban, hogy két különálló ok van a szavak hiányára. A főnevek, az igék, a jelzők és a névmások esetében elméletileg sem lehetséges az összes felsorolása. Nemcsak azért, mert minden osztálynak ezernyi vagy tízezernyi tagja lehet, hanem azért is, mivel folyamatosan hozzáadódnak újak, mint például az MP3 vagy az anime. Ezt a négy kategóriát nyitott osztályoknak (open classes) nevezzük. A többi kategóriát (névmások, névelők, elöljáró- és kötőszók) lezárt osztályoknak (closed classes) hívjuk. Mindegyikben kevés számú szó van (néhánytól pár tucatig), amelyek elméletileg teljesen felsorolhatók. A lezárt osztályok évszázadok folyamán változnak, nem hónapok alatt. Például a „thee” és a „thou” a 17. században elterjedt névmások voltak, hanyatlóban voltak a 19. században, és manapság csak versekben és egyes régiók dialektusában lehet találkozni velük.

22.3. ábra - ℰ0 szókincse
ℰ0 szókincse

22.2.2. Az ℰ0 nyelvtana

A következő lépés a szavak kifejezésekké történő kombinálása. Öt nem záró szimbólumot fogunk használni a különböző típusú kifejezések definiálására: mondat (S), főnévi kifejezés (NP), igei kifejezés (VP), elöljárói kifejezés (PP) és relatív klóz (RelClause).[222] A 22.4. ábra ℰ0 számára mutat egy nyelvtant, minden egyes átíró szabályra példát adva. Az ℰ0 jó angol mondatokat generált, mint amilyenek például a következők:

John is in the pit

The wumpus that stinks is in 2 2

Mary is in Boston and John stinks

Sajnálatos módon a nyelvtan túlgenerál (overgenerates) – előállít olyan mondatokat, amelyek nyelvtanilag helytelenek –, mint például a „Me go Boston” és az „I smell pit gold wumpus nothing east”. Alul is generál (undergenerates): sok olyan angol mondat van, amit elutasít, mint például a „I think the wumpus is smelly”. (Egy másik hátránya, hogy a nyelvtan nem nagybetűvel kezdi a mondatokat, és nem rak pontot a végükre. Ez azért van, mivel elsősorban beszédre tervezték, és nem írásra.)

22.4. ábra - Az ℰ0 nyelvtana, minden egyes szabályra példa kifejezést adva
Az ℰ0 nyelvtana, minden egyes szabályra példa kifejezést adva[222] Egy relatív klóz főnévi kifejezést követ és módosít. (A klóz a nyelvészetben egy alárendelt mellékmondat – a ford.) Egy relatív névmásból (mint a „who” és a „that”) és egy azt követő igei kifejezésből áll. (Egy másik típusú relatív klóz a 22.12. feladatban szerepel.) Példa egy relatív klózra a that stinks a „The wumpus that stinks is in 2 2” mondatban.