Váradi Tamás:

LOKÁLIS GRAMMATIKÁK A MAGYAR NYELVELEMZÉSBEN

(Elõzetes)
 


MOTIVÁCIÓ:

Egy gépi fordítást támogató kétnyelvû szótárnak számot kell adnia olyan megfelelésekrõl, mint pl. „twenty one year old student” – „huszonegy éves diák”. A hagyományos lexikográfiai gyakorlat szerint elég egy ilyen példát megemlíteni, a többit rá lehet bízni az olvasó nyelvi kompetenciájára, amellyel számtalan hasonló kifejezést elõ tud állítani.

Egy explicit és teljes körû számítógépes szótár, ami ez esetben voltaképpen a mentális lexikont jelenti, nyilvánvalóan nem hagyatkozhat erre a módszerre. Hogyan tekintsük tehát az ilyen kifejezéseket, és hogyan modelláljuk ezt a  nyelvi tudást?

VIZSGÁLT KÉRDÉSEK:

* a szófajok szerepe a nyelvleírásban. Mire jók és mire nem?
* a szintaxis autonómiája
* lexikon és szintaxis/szintaxis és szemantika viszonya
* a grammatikalitás mércéje és határai
* korpusz és az „idealizált” nyelvhasználat

TÉZISEK:

* a többszavas kifejezések jelentõs része részlegesen produktív: folytonos skálát alkotnak a teljesen rögzített, és a teljesen nyitott szerkezetek között
* szavak közötti kombinációs szabályok nem írhatók le a szófajok durva kategóriáival
* az adott pozícióba behelyettesíthetõ szavak körét szemantikai jellemzõjük alapján definiálhatjuk
* a szemantikai jegyek egy ontológia keretében öröklõdnek
* a kifejezések szerkezetét leírhatjuk véges állapotú lokális grammatikákkal
* a Maurice Grosstól származó modell hatékonyan megvalósítható az INTEX/NooJ nyelvi fejlesztõ szoftver eszközzel

VÁZLAT:

Az elõadás a kifejezések (phrases, multiword expressions) vizsgálatából indul ki. Elsõsorban az 1b) típusú kifejezésekkel foglalkozik, ahol azt találjuk, hogy a kifejezés egyes alkotórészei kötöttek (*nyelvû lakosság), más elemei többé-kevésbé
nyitottak (lásd orosz/szlovén/olasz nyelvû diákok/férfi stb) .

Ezzel szemben az 1a) példában minden elem rögzített, (nincs bolgár vagy német nátha) az 1c) példának viszont mindkét eleme tetszõlegesen változtatható (lásd francia/kiváló/ költséges iskolarendszer vagy filmipar.)

1a) spanyol nátha
1b) spanyol nyelvû lakosság
1c) spanyol iskolarendszer

Míg 1c) szerkezetét megfelelõen leírhatjuk Adj N kombinációjaként, az 1b) szerkezetek elemei között fennálló szelekciós megszorítások jellemzésére aligha elégségesek a szokásos szófaji kategóriák. Akármilyen belsõ szintaktikai szerkezetet is tulajdonítunk 1b)-nek, nem elégséges Adj Adj N szófajú elemekkel jellemezni az egyes pozíciókba behelyettesíthetõ szavakat. Ehelyett vagy szemantikai jegyekkel vagy akár felsorolással adhatjuk meg a szavak azon körét, amelyek az adott pozícióban elõfordulhatnak. 1b)-t informálisan úgy is jellemezhetjük, mint „Adj<nemzetnév> nyelvû N<személy> „ vagyis a szófajokon belül további csoportokat definiálunk (elsõsorban szemantikai alapon), és a kifejezéseket részben konkrét lexémák, részben pedig az ily módon többé-kevésbé megszorított szóosztályok kombinációjaként jellemezzük. Ott, ahol valamely szóra nem találunk megszorításokat, elegendõ a szófaj szerepeltetése, a szerkezet olyan elemeinek a jellemzésére viszont, amelyek valamilyen megszorításnak eleget kell tegyenek, a releváns csoportot kijelölõ jeggyel (pl. szín, testrész, nemzet, pénz, szám) jellemezzük.

A kifejezések szerkezetének ilyen jellegû megközelítése jellemzi a Maurice Gross által javasolt lokális grammatikákat, amelyek erõsen lexikalizált, szemantikai jellegû véges állapotú grammatikák. A grammatikák megvalósítására Max Silberztein egy nagyon intuitív, könnyen használható szoftver eszközt is kifejlesztett, melynek a gráfok formájában kezelhetõ reguláris grammatikák mellett fontos központi eleme a szintaktikai/szemantikai jegyeket és teljes morfológiát tartalmazó szótár. Elvi szempontból is rendkívül értékes tulajdonsága a rendszernek, hogy a szótár és a nyelvtan egyaránt véges állapotú technológián alapul, ami az 1b) típusú kifejezések kezelésében azt jelenti, hogy a szótár tartalmazhat olyan lokális grammatikákat, amelyek a részlegesen kötött kifejezések
felszíni realizációinak egész sorát tudják generálni.

Az elõadásban bemutatok néhány összetett példát is idõkifejezések lokális grammatikájára.

NYITOTT KÉRDÉSEK:

Meddig mehetünk el a szavak szemantikai szelekciós megszorításainak definiálásában?
Milyen érvénye van a megállapított szabályoknak?
Miféle idealizált nyelvhasználat alapján ítélünk valamely kifejezést szemantikailag
rosszul képzettnek, ha szinte minden kifejezés értelmezhetõ?
Mi a szerepe a nyelvhasználat gyakorisági tényeinek a kifejezések szerkezetének jellemzésében?
stb. stb. stb.