Kollokációk

A kollokációk olyan szavak, amelyek gyakran fordulnak elő együtt. Akkor mondjuk, hogy az x és az y szavak kollokációk, ha x sokkal gyakrabban fordul elő y környezetében, mint másutt.

A Xaira Kollokáció parancsa segítségével megállapíthatja, hogy melyek azok a szavak, amelyeknek a relatív gyakorisága nagyobb egy ablakon belül, mint az egész korpuszban. Az ablak nagyságát vagy a tengelytől balra illetve jobbra eső szavak számával, vagy egy, a környezetet tartalmazó XML elemmel adhatja meg. Az ablak tengelye pedig nem más, mint a lekérdezés fókusza, de a tengely nem része az ablaknak.

A Kollokációk párbeszédpanel

A Kollokációk párbeszédpanelben található vezérlők segítségével megjelenítheti a kollokációkat és a hozzájuk tartozó értékeket. Először is futtason egy lekérdezést. Ez akármilyen típusú lekérdezés lehet, és nem szükséges az összes találatot letöltenie. Ezek után válassza ki a Kollokáció parancsot a Lekérdezés menüből, vagy nyomja meg a fent látható Kollokáció gombot az eszköztárban. Ezáltal megnyitja a Kollokációk párbeszédpanelt:

A keresés fókusza a párbeszédpanel tetején található. A fókusz a következő információkat tartalmazza: (1) a kollokáció alapjául szolgáló lekérdezés nevét ("Query1"); (2) azon találatok számát, amelyeken a kollokációs keresés végbemegy ("58"); (3) a lekérdezés XQL szövegét tartalmazó szövegdobozt.

"A letöltöttek" választónégyzetnek akkor van jelentősége, ha nem töltötte le az összes korpuszban található megoldást (abban az esetben, ha mindet letöltötte, a szóban forgó parancs nem alkalmazható - szürkén jelenik meg). Ha a választónégyzet ki van jelölve, a Xaira a kollokációs értékek meghatározásakor csak a letöltött találatokat veszi figyelembe. Ha a választónégyzet nincs kijelölve, a korpuszban található összes megoldás a keresési folyamat bemenetét képezi. Általában ajánlatos "A letöltöttek" opciót figyelmen kívül hagyni.

A fenti példában a választónégyzet szürkén jelenik meg, mivel az "alkalmatlan" szó mindössze 58-szor fordul elő korpuszunkban. Az "alkalmas" viszont már 303-szor. Ebben az esetben - ha a választónégyzet ki van jelölve - 100 találat fogja képezni a kollokációs keresés bemenetét, míg - ha a választónégyzet nincs kijelölve - a keresés az összes találatot figyelembe veszi:

A kollokációk kereséséhez nyomja meg a SZÁMOL gombot. Ekkor a párbeszédpanelben megjelenik a kollokációk listája.

A korpusz méretétől valamint a beállításoktól függően a kollokációk megjelenítése eltarthat néhány másodpercig.

A CSOMÓPONT oszlop a fókusz kollokációiként felismert szavakat tartalmazza. A GYAKORISÁG oszlopban az látható, hogy a kollokáció milyen gyakran jelenik meg a fókuszt tartalmazó ablakban. A harmadik, Z-ÉRTÉK oszlopban a Z-értékek jelennek meg. Ezek az értékek azt jelzik, hogy statisztikailag milyen erős a fókuszt alkotó szó és a feltételezett kollokáció közötti kapcsolat. (A szóban forgó oszlop az MI-értékeket is tartalmazhat: erről bővebben az alábbiakban olvashat.)

Alapértelmezett esetben a kollokációk listája csökkenő Z-értékek szerint van rendezve. Így a statisztikailag "jobb" kollokációk a lista tetején találhatóak. A megfelelő gombok megnyomásával a kollokációkat gyakorisági vagy ábécé sorrendbe is teheti.

A MENTÉS gomb megnyomásával a kollokációkeresés eredményeit gyakorisági táblázatba mentheti.

A LEKÉRDEZÉS gomb megnyomásával lehetővé válik egy konkrét kollokáció kontextusának megtekintése. Ha kijelöli a listában található kollokációk valamelyikét, majd megnyomja a LEKÉRDEZÉS gombot, a Xaira egy új lekérdezést hoz létre, amely a kollokáció fókuszát alkotó szón kívül tartalmazza a kollokációhoz tartozó másik kifejezést is.

A LEKÉRDEZÉS gomb megnyomásával egyúttal a Kollokáció ablakot is bezárja. Ezt az ablakot újra megnyithatja, ha visszatér az eredeti lekérdezéshez és alkalmazza a Kollokáció parancsot.

A program általában minden, az ablakban található kollokációt megjelenít. Lehetőség van azonban a keresés szűkítésére is. A keresés szűkítéséhez írjon be egy keresési kifejezést a párbeszédpanel Fókusz része alatt található szövegdobozba.

Miután megadott egy keresési kifejezést, nyomja meg a SZÁMOL gombot, ekkor csak a megadott kifejezésre is illeszkedő kollokációk fognak megjelenni. Az itt használható keresési kifejezések megegyeznek a Szó lekérdezése párbeszédpanelben használhatóakkal. Így tehát ha egy karaktersorozat beírása után megnyomja a SZÁMOL gombot, csak olyan kollokációk fognak megjelenni, amelyek tartalmazzák a megadott sztringgel kezdődő szavakat is:

Ha kijelöli a "Minta" választónégyzetet, akkor a program a begépelt keresési kifejezés mintaként értelmezi, és csak olyan kollokációkat jelenít meg, amelyek illeszkednek a szóban forgó mintára:

A szövegdoboz mellett található gomb megnyomásával megnyitja a Billentyűzet párbeszédpanelt.

További vezérlőeszközök

A Kollokációk párbeszédpanel középső területén a keresés aktuális beállításai tekinthetőek meg. Például:

A képen az óramutató járásával megegyező irányban a következő adatok láthatóak: a fókuszt tartalmazó ablak mérete (amelyen belül a program a kollokációkat keresi); az a statisztikai érték, ami alapján a kollokációkat rendezve vannak; milyen korlátozások vannak érvényben a letöltendő kollokációk számára nézve (ebben az esetben nincs ilyen: minden találatot letölt); végül az arra vonatkozó információ, hogy keressen-e kolligációkat (ebben az esetben nem).

Mindezek a beállítások megváltoztathatók a Kollokációk párbeszédpanelben található vezérlők segítségével. A vezérlők megjelenítéséhez jelölje ki a Vezérlők választónégyzetet a párbeszédpanel jobb alsó sarkában. Ekkor a Kollokációk parancshoz tartozó további panelek válnak láthatóvá:

Ahogy a képen is látható, öt különböző panel jelenik meg. Ezek sorrendben a Letöltés, Lemmák, Ablak, Érték és Kolligáció. Részletes leírásuk az alábbiakban olvasható.

A Letöltés panel

Alapértelmezett esetben a Xaira minden megfelelő kollokációt letölt (azaz megjelenít a kollokációs listában). Előfordulhatnak azonban olyan esetek, például, ha a keresési ablak nagy, hogy célszerűbb csak a magasabb értékekkel rendelkező találatokat letölteni. Ilyenkor választhat, hogy csak a legnagyobb értékekkel rendelkező találatokat vagy csak egy bizonyos küszöbnél magasabb értékkel rendelkező kollokációkat tölt le. Sokszor hasznosnak tűnhet az ablakban csak ritkán előforduló szavak kizárása is, hiszen elképzelhető, hogy a nekik tulajdonított magas érték véletlen egybeesés következménye.

A Letöltés panelben található vezérlők segítségével korlátozhatja a a letöltendő elemek számát. Például:

A három rádiógomb segítségével adhatja meg, hogy hány kollokációt kíván letölteni. Ha az összeset le akarja tölteni, jelölje meg az első rádiógombot. Ez az alapértelmezett beállítás is.

Ha csak a legmagasabb értékekkel rendelkező találatokat kívánja letölteni, jelölje meg a második rádiógombot, és adja meg a megtekinteni kívánt kollokációk számát. Így például, ha "5"-öt ír a megfelelő mezőbe, majd megnyomja a SZÁMOL gombot, az öt legmagasabb értékkel rendelkező kollokáció fog megjelenni.

Ha a harmadik rádiógombot jelöli meg, akkor azokat a kollokációkat tölti le, amelyek egy Ön által megadott értéknél magasabb értékkel rendelkeznek. Az értéket a rádiógomb melletti szövagablakban adhatja meg. Így például, ha a "20"-at írja be, csak azok a kollokációk fognak megjelenni, amelyek Z-értéke (vagy MI értéke, ha éppen azt használja) nagyobb, mint húsz.

A választott letöltési opció megjelenik a Kollokációk párbeszédpanel közepén is.

A vízszintes vonal alatt egy további opció található: itt zárhat ki a kollokációs listáról olyan szavakat, amelyeknek a fókusz körnezetében vett gyakorisága az Ön által megadott küszöb alatt van.

Így, ha "7"-et ír be ide, a Xaira minden olyan kollokációt figyelmen kívül hagy, amelynek a (a kollokációs lista középső oszlopában található) gyakorisága nem nagyobb hétnél. Ezen beállítás alapértelmezett értéke nulla (ami azt jelenti, hogy nincsen figyelmen kívül hagyott kollokáció).

Minden - a letöltések számára vonatkozó - korlátozás a legközelebbi változtatásig érvényben marad (még akkor is, ha a Letöltés panel rejtett).

A Lemmák panel

A Xaira általában szóalakokat keres a kollokációs ablakban (vagy kolligáció esetén szófajtípusú Hozzáadott-kulcsokat; lásd alább). Mindazonáltal lehetősége van arra is, hogy az ablakban előforduló szavakat lemmájuk szerint csoportosítsa. Ehhez a korpusznak tartalmaznia kell a megfelelő információt, és a lemmát Hozzáadott-kulcsként kellett indexálni.

Ezáltal lehetővé válik, hogy egyetlen egy lexikai tétel - például az eszköz - minden előfordulását egy csoportba soroljuk függetlenül a morfoszintaktikai eltérésektől. Így például az "eszköz", "eszköze" és "eszközök" együtt képeznék a kollokációszámítás bemenetét.

A Lemmák panelen található legördülő listából választhatja ki az alkalmazásra kerülő lemmasémát:

Alapértelmezett esetben a program a "null" lemmasémát használja; ez a séma minden eltérő szóalakot önálló lemmaként kezel. A legördülő mezőből választhat másik lemmasémát; a kiválasztás után nyomja meg az ALKALMAZ gombot.

A fenti példákban csak egy "null"-tól különböző lemmatizációs séma van felsorolva (amely találóan a "lemma" nevet kapta). Ha a lista a "null" lemmasémán kívül nem tartalmaz mást, akkor a korpuszhoz nincs hozzárendelve lemmaséma. Új lemmaséma nem adható hozzá egy már indexált korpuszhoz.

A megadott lemmaséma a legközelebbi változtatásig érvényben marad (még akkor is, ha a Lemmák panel rejtett)

Fontos megjegyezni, hogy a kolligációk keresése érvényteleníti a lemmák szerinti keresést. Ez azt jelenti, hogy ha a Kolligáció panelben megad egy Hozzáadott-kulcsot, a program figyelmen kívül hagyja a már specifikált lemmatizációs sémát.

Az Ablak panel

Ahogy már fent is említettük az ablak a lekérdezés fókusza melletti terület, amelyben a Xaira kollokációkat keres. Alapértelmezett esetben az ablak a fókusz jobb- és baloldali egyszavas környezete. Az Ablak panelben található vezérlők segítségével módosíthatja az ablak nagyságát:

Az ábrán látható görgetődobozok segítségével adhatja meg, hogy balról és jobbról hány szóból álljon az ablak. Az ablak méretének specifikálására egy másik lehetőség egy XML elem hatókörének megadása. Ehhez jelölje ki az "XML" választónégyzetet és válasszon ki egyet a listában megjelenő XML elemek közül. Ilyenkor minden olyan szó, amely az adott XML elemen belül található, az ablak részét fogja képezni. Így például, ha s-et választja, minden, a szóban forgó <s> elemen (vagyis a mondaton) belül előforduló szó az ablak része lesz.

A Kollokációk párbeszédpanel beállításokat megjelenítő középső részén látható, hogy a program éppen mekkora ablakot használ.

Az ablak méretének megváltoztatása után nyomja meg a SZÁMOL gombot, hogy megtekinthesse az új kollokációs listát.

Az Érték panel

Minden kollokációhoz egy statisztikai mérőszám van rendelve, amely azt jelzi, hogy a fókusz szó és a feltételezett kollokáció között milyen erős kapcsolat áll fenn. Ez azért fontos, mert a kollokációk általában akkor érdekesek, ha szokatlanul gyakoriak a megadott ablakban. Vagyis - másképpen fogalmazva - sokkal gyakrabban fordulnak elő az ablakban, mint az várható lenne gyakoriságuk alapján a teljes korpuszban.

Számos különböző javaslat született arra vonatkozóan, hogy hogyan mérjük a kollokációk erősségét. A Xaira ezek közül a két legnépszerűbbet használja: a Z-értéket és az MI-értéket

A Z-érték annak a mértéke, hogy milyen valószínűtlen az, hogy a fókusz és a kollokáció nem állnak kapcsolatban egymással. Az MI a két szó együttes előfordulásának valószínűsége osztva a külön-külön való előfordulásuk valószínűségének szorzatával.

Alapértelmezett esetben a Xaira a Z-értéket használja. Ha az MI-értékre kíván váltani, használja az Érték panelben található vezérlőeszközöket:

Ha a beállított értéken változtatni szeretne, válassza ki a megfelelő értéket a legördülő mezőből.

A kiválasztott érték a Kollokációk párbeszédpanel középső területén is megjelenik.

Az Érték panel alsó részén található parancs segítségével összehasonlíthatja egy adott kollokációra vonatkozó Z- és MI-értékeket. Először, írjon be egy kollokációt a szövegdobozba. (Ha szükséges, a gomb segítségével megnyithatja a Billentyűzet párbeszédpanelt.)

Ezek után nyomja meg a MEHET gombot. Ekkor minden a megadott szóra és a fókuszra vonatkozó kollokációs érték megjelenik. Például:

Ha az Ön által megadott szó és a fókusz nem kollokációk, semelyik érték sem jelenik meg.

A Kolligáció panel

A kolligáció a szófaji kategóriára vonatkozó kollokáció. Ha egy egyszerű kollokációra kíváncsi, a Xaira olyan szóalakokat keres, amelyek sokkal gyakrabban fordulnak elő a megadott ablakban, mint máshol a korpuszban. Ezzel szemben, ha a Kolligáció választónégyzet van kijelölve, a program olyan hozzáadott-kulcsokat keres, amelyek sokkal gyakrabban fordulnak elő a specifikált ablakban, mint máshol.

Ha kolligációt keres, használja az alul látható Kolligáció panelt:

Jelölje ki a Kolligáció választónégyzetet, ahogy fent is látható.

Ezek után válassza ki, hogy melyik Hozzáadott-kulcs alapján kíván keresni. A rendelkezésre álló Hozzáadott-kulcsok készlete egyrészt a használt korpuszban található jelölőelemektől, másrészt az indexálástól függ.

A Kollokációk párbeszédablak közepén ez a beállítás is megjelenik. Nyomja meg a SZÁMOL gombot, így a program megjeleníti a kolligációra vonatkozó értékeket. Ebben az esetben ez azt jelenti, hogy azok a szófajkódok (vagy morfoszintaktikai kódok) lesznek felsorolva, amelyek sokkal gyakrabban szerepelnek a keresés fókuszának környezetében, mint máshol.

Ha ismét kollokációkat kíván keresni, szüntesse meg a Kolligáció panelen a választónégyzet kijelölését.