Válassza ki ezt a parancsot, ha a korpuszhoz új felosztást kíván létrehozni.
Mi a felosztás?
A felosztás nem más, mint egy séma, amely mentén a szövegeket meghatározott osztályokba sorolhatja. Ha a korpuszra definiál egy felosztást, megnézheti, hogy egy lekérdezés eredményei milyen módon oszlanak meg a különböző szövegosztályok között - itt talál további részleteket - vagy a lekérdezést egy szövegosztályra is korlátozhatja - részletekért kattintson ide.
Alapértelmezett helyzetben a Xaira minden betöltött korpuszra az "all" ("minden") felosztási sémát alkalmazza. Ez a felosztás - a korpusz fejléc ("corpus header") kivételével - az összes szöveget a Texts (Szövegek) nevű osztályba sorolja. A korpusz fejléc pedig a Header (Fejléc) nevű osztályba kerül. A program egy "#default" nevű felosztást is létrehoz, amely a szövegek fejlécében található <catRef> elem által tartalmazott információn alapul. A "#default" felosztás definiálása során a program feltételezi, hogy a korpusz rendelkezik a megfelelő jelölőelemekkel.
A Felosztás létrehozása parancs segítségével az alapértelmezett felosztások mellett új felosztásokat is definiálhat.
Az Új felosztás párbeszédpanel
A Felosztás létrehozása paranccsal az alábbi párbeszédpanelt nyithatja meg:
A felső három mezőben állíthatja be a felosztás nevét, itt adhatja meg a felosztásra vonatkozó leírást valamint az elmentett felosztás elérési útvonalát is. Az alsó három mező a felosztáson belüli osztályok meghatározására szolgál.
A legfelső szövegdobozba írja be a felosztás nevét. A felosztásra vonatkozó leírás megadása nem kötelező, de hasznos lehet például akkor, ha a felosztást mások is használják.
A felosztás nevének megadása után a Xaira automatikusan létrehozza a felosztás elérési útvonalát. Alapértelmezett esetben a mentett felosztás a megnyitott korpusz "Usr" könyvtárába kerül *.sc kiterjesztéssel. A fájl neve az Ön által megadott név lesz. Ha szükséges, módosíthaja az alapértelmezett elérési útvonalat. A Tallózás gomb segítségével határozhatja meg a könyvtárfában a mentendő felosztás helyét.
A párbeszédpanel alsó részén látható, hogy háromféleképpen definiálhat egy felosztást. A lehetőségek közül a rádiógomb segítségével pontosan egyet kiválasztva adja meg, hogy melyik módszert kívánja használni.
Hogyan hozhat létre olyan felosztást, amely az Ön által megadott osztályokat tartalmazza?
Egy felosztás létrehozásának legegyszerűbb módja az, hogy "kézzel" megadja az osztályoknak egy halmazát. Ezt a módszert "üres" felosztás létrehozásának hívjuk, mivel eredetileg az összes szöveg a felosztás egy osztályához van rendelve. Ilyenkor saját kezűleg kell a szövegeket a korábban már létrehozott osztályokhoz rendelni.
A "kézi" felosztáshoz először szüksége van az osztályok egy listájára.
Minden létrehozni kívánt osztály esetében adjon meg egy nevet a terület fenti részén található szövegdobozban, majd nyomja meg a HOZZÁAD gombot.
A fenti példában négy osztályt hoztunk létre, így a Magyar Nemzeti Szövegtár szövegeit aszerint osztályozhatjuk, hogy ezek milyen típusú alkorpuszba tartoznak. Az ötödik osztály, a "személyes" még nem létezik, de ha a felhasználó megnyomja a HOZZÁAD gombot, ez is felkerül a listára.
Ha egy már a listán szereplő osztályról úgy dönt, hogy még sincs rá szüksége, az adott osztály kijelölése után a TÖRÖL gomb megnyomásával távolíthatja el azt a listáról.
Ha a felvett osztályokat megfelelőnek találja, nyomja meg az OK gombot, ezáltal létrejön a kívánt felosztás.
Ám nem szükséges a felosztás összes osztályát kimerítően megadnia. A felosztás tulajdonságai paranccsal később is hozzáadhat új osztályokat a már meglévőkhöz. Ezen parancs segítségével módosíthatja a felosztás nevét, az elérési útvonalát és a felosztásra vonatkozó leírást is.
Felosztás létrehozása egy oszlopban található értékek alapján
Oszlopoknak azokat a korpusz ablakban megjelenített függőlegesen elrendezett értékeket nevezzük, amelyeknek fejcímkéjén valamilyen XML jelölőelem szerepel. Bármilyen oszlopból származó értékeket használhat, ha az oszlop meg van jelenítve a korpusz ablakban. Az aktív oszlopok listája megtekinthető a szóban forgó opció alatti mezőben (kattintson ide, ha az XML jelölőelemeken alapuló oszlop létrehozására kíváncsi). Az alábbi példában 2 XML jelölőelem alapján készítettünk oszlopokat, így a két oszlopban található értékek alapján hozhatunk létre felosztásokat. Az XML jelölőelemek lehetnek tagnevek és attribútumok egyaránt, az oszlopokban szereplő értékek pedig - ennek megfelelően - tagpárok tartalmai vagy attribútumértékek.
Jelölje ki a szövegdobozban annak az elemnek a nevét, amely alapján el akarja készíteni a felosztást, majd nyomja meg az OK gombot.
Ha már létrehozta a felosztást, a program a szövegeket az oszlop tartalma alapján osztályozza. Vegyük a fent szereplő "type" attribútumon alapuló felosztást. A "type" a Magyar Nemzeti Szövegtárban szereplő attribútum az eredeti dokumentum típusára utal. Ez lehet felszólalás, cikk, weboldal, fórum stb. Ha ezt az attribútumot használjuk felosztás készítésére, akkor egy osztályba kerülnek a felszólalások, egy másik osztályt fognak alkotni a weboldalak, egy harmadikat a felszólalások, stb.
A másik fent szereplő XML jelölőelem a pubDate. Ez az egyes dokumentumok megjelenési idejét tartalmazó tag. Egy ilyen osztályozás alapján - ha korpuszunk tartalmazná a megfelelő szépirodalmi szövegeket - a büszkeségésbalítélet.xml egy 1813 nevű osztályba kerülne, békaváriuraság.xml egy 1908 nevűbe, akárcsak a anneotthonratalál.xml, míg az ezerkilencszáznyolcvannégy.xml egy 1948 nevűbe. A hozzárendelés feltételezi, hogy a korpuszban szereplő, idevonatkozó információk megfelelnek a valóságnak.
Felosztás létrehozása egy lekérdezés találatai alapján
Bármelyik megnyitott lekérdezés találatai alapján készíthet felosztást. Ehhez jelöljön ki egyet a listában szereplő lekérdezések közül.
Minden korpuszban szereplő szöveg két osztály valamelyikéhez lesz rendelve - a T (igaz) osztályhoz, ha a szöveg tartalmaz találatot az adott lekérdéshez, és az F (hamis) osztályhoz, ha nem tartalmaz.
Az ilyen típusú felosztások teszik lehetővé olyan elemzések készítését, amelyek már csak azokat a szövegeket vizsgálják, ahol az előző lekérdezés találatot eredményezett. Ennek egyik módja, hogy a "T" osztályt aktiváljuk a lekérdezések futtatása előtt.
Saját felosztás létrehozása
Nyomja meg az OK gombot, ha létre kívánja hozni a párbeszédpanelben meghatározott felosztást. Nyomja meg a Mégse gombot, ha be szeretné zárni a párbeszédpanelt a felosztás létrehozása nélkül. Ha az OK gombot választja, a program aktiválja és menti az újonnan létrehozott felosztást.
A szövegek osztályokhoz rendelése
Ha az "Üres felosztás készítése ezekkel az osztályokkal" opciót választja, a Xaira minden korpuszban található szöveget alapértelmezés szerint az első osztályhoz rendel. Ha a másik két opció valamelyikét használja, az, hogy a program melyik osztályhoz rendeli a szövegeket, attól függ, hogy a korpusz ablakban milyen információ jelenik meg róluk. Bármelyik esetben lehetőség van arra, hogy egy szöveget új osztályhoz rendeljünk.
Az új osztályhoz való hozzárendelés vagy úgy tehető meg, hogy egy vagy több szöveg kijelölése után alkalmazza a Szöveg menüben található Kijelöltek osztályozása parancsot, vagy úgy, hogy jobb-egérrel rákattint egy szöveg nevére, és a megjelenő helyzetérzékeny menü alsó feléből kiválasztja a megfelelő osztályt.
A változtatás elvégzése után alkalmazza a Szöveg menüben található Felosztás mentése parancsot. Enélkül a nem menetett hozzárendelések elvesznek a program bezárásakor.