Mi a Xaira?

A Xaira (XML Aware Indexing and Retrieval Architecture) olyan eszköz, amely nyelvészeti adatok keresését, kivonatolását és megjelenítését teszi lehetővé XML erőforrásokból, például nyelvi korpuszokból. A Xaira elődje a Sara, amely a British National Corpus projekt részeként fejlesztettek ki (lásd http://www.natcorp.ox.ac.uk).

A Xaira fejlesztői Lou Burnard és Tony Dodd. A program terjesztője az Oxford University Computing Services-hez tartozó Research Techonologies Service.

A Xaira keresési művelete indexeken alapul. Ez azt jelenti, hogy a program nem közvetlenül a korpuszban keres, hanem indexeket használ az Ön által megjeleníteni kívánt egységek helyének meghatározására.

Így tehát ahhoz, hogy a Xaira korpuszban való keresésre használható legyen, a korpuszt először indexálni kell. Az indexeket egy önálló program hozza létre: a Xaira-indexer. A program az indexeket egy a TEI szabványnak megfelelő korpuszfejléc (corpusheader fájl) ellenőrzése alatt generálja. A Xaira-tools program az indexálót egy egyszerű Windows interfésszel egyesíti.

A Xaira jelenlegi verziójával elsősorban az Ön számítógépén található korpuszok lekérdezése lehetséges. Emellett azonban a Xaira alkalmas hálózati szerveren lévő korpuszok elérésére is, emiatt a programra néha a kliens program kifejezéssel hivatkozunk.

A korpuszt alkotó fájlok elrendezése más és más lehet, attól függően, hogyan indexálta a korpuszt. Azonban minden indexált korpusz az Xcorpus file által van a Xaira-hoz társítva. (Az Xcorpus fájl egy *.xcorpus kiterjeszéssel rendelkező fájl, pl.: korpusz.xcorpus).

A Xaira-ban kétféleképpen nyithat meg egy korpuszt. Vagy dupla kattintással megnyitja a társított Xcorpus fájlt, vagy a Fájl menüben található Megnyitás parancsot használja. Ezután a Xaira készen áll a lekérdezések végrehajtására.