Váradi Tamás:
LOKÁLIS GRAMMATIKÁK A MAGYAR NYELVELEMZÉSBEN
(Elõzetes)
MOTIVÁCIÓ:
Egy gépi fordítást támogató kétnyelvû szótárnak számot kell adnia olyan megfelelésekrõl, mint pl. twenty one year old student huszonegy éves diák. A hagyományos lexikográfiai gyakorlat szerint elég egy ilyen példát megemlíteni, a többit rá lehet bízni az olvasó nyelvi kompetenciájára, amellyel számtalan hasonló kifejezést elõ tud állítani.
Egy explicit és teljes körû számítógépes szótár, ami ez esetben voltaképpen a
mentális lexikont jelenti, nyilvánvalóan nem hagyatkozhat erre a módszerre.
Hogyan tekintsük tehát az ilyen kifejezéseket, és hogyan modelláljuk ezt a
nyelvi tudást?
VIZSGÁLT KÉRDÉSEK:
* a szófajok szerepe a nyelvleírásban. Mire jók és mire nem?
* a szintaxis autonómiája
* lexikon és szintaxis/szintaxis és szemantika viszonya
* a grammatikalitás mércéje és határai
* korpusz és az idealizált nyelvhasználat
TÉZISEK:
* a többszavas kifejezések jelentõs része részlegesen produktív: folytonos
skálát alkotnak a teljesen rögzített, és a teljesen nyitott szerkezetek között
* szavak közötti kombinációs szabályok nem írhatók le a szófajok durva
kategóriáival
* az adott pozícióba behelyettesíthetõ szavak körét szemantikai jellemzõjük
alapján definiálhatjuk
* a szemantikai jegyek egy ontológia keretében öröklõdnek
* a kifejezések szerkezetét leírhatjuk véges állapotú lokális grammatikákkal
* a Maurice Grosstól származó modell hatékonyan megvalósítható az INTEX/NooJ
nyelvi fejlesztõ szoftver eszközzel
VÁZLAT:
Az elõadás a kifejezések (phrases, multiword expressions) vizsgálatából indul
ki. Elsõsorban az 1b) típusú kifejezésekkel foglalkozik, ahol azt találjuk, hogy
a kifejezés egyes alkotórészei kötöttek (*nyelvû lakosság), más elemei
többé-kevésbé
nyitottak (lásd orosz/szlovén/olasz nyelvû diákok/férfi stb) .
Ezzel szemben az 1a) példában minden elem rögzített, (nincs bolgár vagy német
nátha) az 1c) példának viszont mindkét eleme tetszõlegesen változtatható (lásd
francia/kiváló/ költséges iskolarendszer vagy filmipar.)
1a) spanyol nátha
1b) spanyol nyelvû lakosság
1c) spanyol iskolarendszer
Míg 1c) szerkezetét megfelelõen leírhatjuk Adj N kombinációjaként, az 1b)
szerkezetek elemei között fennálló szelekciós megszorítások jellemzésére aligha
elégségesek a szokásos szófaji kategóriák. Akármilyen belsõ szintaktikai
szerkezetet is tulajdonítunk 1b)-nek, nem elégséges Adj Adj N szófajú elemekkel
jellemezni az egyes pozíciókba behelyettesíthetõ szavakat. Ehelyett vagy
szemantikai jegyekkel vagy akár felsorolással adhatjuk meg a szavak azon körét,
amelyek az adott pozícióban elõfordulhatnak. 1b)-t informálisan úgy is
jellemezhetjük, mint Adj<nemzetnév> nyelvû N<személy> vagyis a szófajokon
belül további csoportokat definiálunk (elsõsorban szemantikai alapon), és a
kifejezéseket részben konkrét lexémák, részben pedig az ily módon többé-kevésbé
megszorított szóosztályok kombinációjaként jellemezzük. Ott, ahol valamely szóra
nem találunk megszorításokat, elegendõ a szófaj szerepeltetése, a szerkezet
olyan elemeinek a jellemzésére viszont, amelyek valamilyen megszorításnak eleget
kell tegyenek, a releváns csoportot kijelölõ jeggyel (pl. szín, testrész,
nemzet, pénz, szám) jellemezzük.
A kifejezések szerkezetének ilyen jellegû megközelítése jellemzi a Maurice
Gross által javasolt lokális grammatikákat, amelyek erõsen lexikalizált,
szemantikai jellegû véges állapotú grammatikák. A grammatikák megvalósítására
Max Silberztein egy nagyon intuitív, könnyen használható szoftver eszközt is
kifejlesztett, melynek a gráfok formájában kezelhetõ reguláris grammatikák
mellett fontos központi eleme a szintaktikai/szemantikai jegyeket és teljes
morfológiát tartalmazó szótár. Elvi szempontból is rendkívül értékes
tulajdonsága a rendszernek, hogy a szótár és a nyelvtan egyaránt véges állapotú
technológián alapul, ami az 1b) típusú kifejezések kezelésében azt jelenti, hogy
a szótár tartalmazhat olyan lokális grammatikákat, amelyek a részlegesen kötött
kifejezések
felszíni realizációinak egész sorát tudják generálni.
Az elõadásban bemutatok néhány összetett példát is idõkifejezések lokális
grammatikájára.
NYITOTT KÉRDÉSEK:
Meddig mehetünk el a szavak szemantikai szelekciós megszorításainak
definiálásában?
Milyen érvénye van a megállapított szabályoknak?
Miféle idealizált nyelvhasználat alapján ítélünk valamely kifejezést
szemantikailag
rosszul képzettnek, ha szinte minden kifejezés értelmezhetõ?
Mi a szerepe a nyelvhasználat gyakorisági tényeinek a kifejezések szerkezetének
jellemzésében?
stb. stb. stb.