Lexikográfiai Osztály

Nyitólap > Osztályok > Lexikográfiai Osztály > Korábbi kutatások (-2020)

Korábbi kutatások (-2020)

Az osztály fő kutatási területe magyar egynyelvű szótárak készítése. E munkaközösségben készült az 1950–60-as években A magyar nyelv értelmező szótára 1–7. (ÉrtSz.; főszerk.: Bárczi Géza és Országh László, Akadémai Kiadó, Budapest, 1959–1962), illetve a Magyar értelmező kéziszótár (ÉKsz.; szerk.: Juhász József, Szőke István, O. Nagy Gábor és Kovalovszky Miklós, Akadémiai Kiadó, Budapest, 1972).

I. A magyar nyelv nagyszótára (Nszt.)

Az osztály legfontosabb feladata jelenleg A magyar nyelv nagyszótárának készítése. A szótár a szöveg tartalmi egységeinek azonosítását lehetővé tevő XML (= Extended Markup Language) formátumú adatbázisként készül. A mintegy százezer szócikkben 110 ezer címszót feldolgozó, több mint 20 kötetesre tervezett sorozat elsősorban a köz- és irodalmi nyelv, illetve kisebb részben egyéb nyelvi rétegek (tájnyelv, szaknyelv, szleng stb.) szókészletét mutatja be a nyelvújítás korától napjainkig, nyomtatásban megjelent szövegek felhasználásával.

Forrásanyaga a kb. 30 millió szövegszónyi elektronikus Magyar történeti szövegtár (MTSz.), a mintegy 6 millió cédulából álló archivális gyűjtemény, amelyet a 19. század végétől a 20. század közepéig hoztak létre, valamint egy CD-tár anyaga összesen több mint 335 millió szóval. Az 1985 és 2000 között összeállított Magyar történeti szövegtár első kiegészítése és javítása 2005-ben történt, 2015 végére pedig befejeződött a korpuszbővítés újabb szakasza, amelynek során a korpusz felső korhatára 2010-re emelkedett.

A szövegtárak archiválási módszereiben voltaképpen leképeződik korunk digitális fejlődése. Az 5-6 millió cédulából álló archivális gyűjtemény annak idején kézzel vagy írógéppel, A6-os méretű papírlapokra írva készült. Az elektronikus korpusz építése és első bővítése során az adatrögzítő munkatársak még szintén kézzel rögzítették a kijelölt szövegrészeket, de fénymásolataikról már egyre modernebb számítógépekbe írták azokat. A 2014–2015-ben folyó korpuszbővítés során az optikai karakterfelismertetésnek jutott a főszerep. Mivel az ezt a feladatot elvégző szoftver, az ABBYY FineReader számára a „nyersanyag”, a kiindulópont valamilyen képformátumú állomány, azokról a könyv- és újságoldalakról, amelyek az új szövegeket tartalmazták, fotódokumentációt kellett készíteni. Ez néhány száz oldal esetében digitális fényképezőgéppel való képkészítést, a szövegek többségénél azonban szkennelést jelentett. A képfájlok elkészítése után karakterfelismertető programmal folyt a szövegfájlok előállítása, amelyek a szoftver „érzékenysége” és az általa használt szótárak fejlettsége következtében egy átlagos dokumentumoldal adattartalmát – ideértve a formázásokat is – közel százszázalékos pontossággal adták vissza. Az így létrejött, illetve kiegészült, ellenőrzött-korrektúrázott anyag a magyar szókincs történetének vizsgálatához és különféle szótárírási munkákhoz kínál jó alapot. A Magyar történeti szövegtár kutatási célból külső felhasználók számára is hozzáférhető. A korpuszban feldolgozott, filológiailag ellenőrzött források bibliográfiai adatait tartalmazó, összesen több mint 30 000 tételes XML formátumú forrásjegyzékek szintén elérhetők az interneten.

Ez a nagyszótári jellegű, értelmező és történeti típusú szótár az 1772 és 2010 közötti korszak szókincsét minden eddigi szótárnál bővebb címszókészlettel és gazdagabb jelentésszerkezettel mutatja be, érzékeltetve a lexémák történeti fejlődését is. A jelentéseket példamondatokkal illusztrálja, megjelölve azok pontos lelőhelyét. Minden esetben felveszi a szótár az adott jelentés korpuszbeli első előfordulását, és a modern nemzetközi lexikográfiai gyakorlattal összhangban világosan megkülönböztetve, önálló nyelvi egységként dolgozza fel az ún. értelmezett szókapcsolatokat, idiomatizmusokat, illetve a szóadatokat. A szótár jelentős számú szaknyelvi szót is tartalmaz, s – a magyar lexikográfia történetében egyetlenként – ezeknek a szavaknak az értelmezéseit a különböző tudomány- vagy szakterület jeles képviselőivel szakmai szempontból lektoráltatja. Az adatbázis formátum folyamatos bővíthetőséget és frissíthetőséget tesz lehetővé, illetve a legkülönfélébb szempontok szerinti keresésre, csoportosításra és összehasonlításra ad módot.

A magyar nyelv nagyszótárának 2006 óta hat kötete jelent meg. Az első kötet a szótár használatához szükséges segédleteket tartalmazza: tájékoztat a szótár jellegéről, szerkezetéről és lexikográﬁai elveiről, rövid ismertetést ad a nagyszótári munkálatok történetéről, a szótári feldolgozás alapjául szolgáló szöveggyűjtemények összetételéről, illetve a szótári adatbázis és a korpusz informatikai hátteréről. Ebben a kötetben kapott helyet a szöveggyűjtemények mintegy harmincezer tételes bibliográﬁája, a szótár ﬁlológiai módszereinek és megoldásainak ismertetése, valamint a szerzői névlista, amely a forrásjegyzékekben szereplő szerzőket és az idegen nyelvből fordított művek eredeti szerzőit tartalmazza. A segédletek kötetében találhatók a magyar szókészlet paradigmáit, ragozási sorait áttekinthető formában bemutató táblázatok, valamint az a rövidítésjegyzék, amely a lexikográﬁai leírásban használt rövidítéseket, nyelvtani és lexikai minősítéseket sorolja fel. A 2. kötet több mint öt és félezer a és á betűs címszót, a 3. és 4. kötet több mint hatezer b betűs címszót dolgoz fel. Az 5. kötet a c és cs betűs szavakat, valamint a d betűs anyag első felét, a 6. kötet a d betűs szavak második felét és az e–ek kezdetű anyagrészt tartalmazza. A példamondatokban előforduló rövidítések jegyzékét, valamint a forrásjegyzék kiegészítéseit az egyes szótári kötetek közlik.

2017 eleje óta A magyar nyelv nagyszótára elérhető a weben.

Ittzés Nóra (főszerk.): A magyar nyelv nagyszótára. 1. Segédletek. MTA Nyelvtudományi Intézet, Budapest, 2006. 1119 p.

Ittzés Nóra (főszerk.): A magyar nyelv nagyszótára. 2. A–azsúroz. MTA Nyelvtudományi Intézet, Budapest, 2006. 1550 p.

Ittzés Nóra (főszerk.): A magyar nyelv nagyszótára. 3. B–bes. MTA Nyelvtudományi Intézet, Budapest, 2011. 1039 p.

Ittzés Nóra (főszerk.): A magyar nyelv nagyszótára. 4. Besz–by. MTA Nyelvtudományi Intézet, Budapest, 2011. 1020 p.

Ittzés Nóra (főszerk.): A magyar nyelv nagyszótára. 5. C–dézs. MTA Nyelvtudományi Intézet, Budapest, 2013. 1247 p.

Ittzés Nóra (főszerk.): A magyar nyelv nagyszótára. 6. Di–ek. MTA Nyelvtudományi Intézet, Budapest, 2016. 980 p.

II. Új magyar etimológiai szótár (ÚESz.)

Az osztályon folynak egy új etimológiai szótár munkálatai is.

Immáron több mint másfél évtizede, hogy megjelent az utolsó, nemzetközi szinten is magas színvonalúnak tekintett magyar etimológiai szótár, az Etymologisches Wörterbuch des Ungarischen 1–3 (EWUng.; főszerk.: Benkő Loránd, Akadémiai Kiadó, Budapest, 1993–1997). A mű címe is mutatja, hogy a szótár metanyelve a német: ezáltal válhattak az etimológiát más országokban művelők számára is hozzáférhetővé a magyar etimológiai kutatások akkori legfrissebb eredményei. A kedvező nemzetközi fogadtatás ellenére az említett szótár Magyarországon az elvárhatónál kevésbé vált ismertté, aminek több oka is van. Első helyen (sajnálatos módon) a szótár nem magyar közvetítő nyelvét kell akadályként említeni; másodsorban a (magyar viszonyok között akkoriban) magas árat; harmadsorban pedig azt, hogy csak igen alacsony példányszámban jelent meg a szótár (újabb kiadás lehetősége föl sem merült). Ezért sokan még mindig úgy tudják, hogy A magyar nyelv történeti–etimológiai szótára 1–4. (TESz.; főszerk.: Benkő Loránd, Akadémiai Kiadó, Budapest, 1967–1984) az egyetlen ilyen jellegű (egyébiránt kiváló) magyar kézikönyv.

Tekintettel a fentiekre, illetve az 1990-es évek közepét követő újabb etimológiai kutatások során – elsősorban a turkológia, továbbá a szlavisztika területén, illetőleg a Magyar értelmező kéziszótár 2. kiadásához (ÉKsz.2; főszerk.: Pusztai Ferenc, Akadémiai Kiadó, Budapest, 2003) kapcsolódóan – feltárt eredményekre, lehetségessé vált és szükségesnek mutatkozik egy újabb magyar nyelvű, a tudományos igényeket is kielégítő szófejtő (és bizonyos mértékben szótörténeti) szótár összeállítása.

A munkálatok 2011 februárja és 2015 januárja között OTKA-támogatás keretében Gerstner Károly tudományos főmunkatárs vezetésével folynak.

Az ÚESz. a tervek szerint mintegy tízezer önálló szócikkben nagyjából tizenötezer fő- és alcímszót tartalmaz majd. Ez valamivel több, mint a TESz. és az EWUng. címszóállománya, de az egyszerű számbeli eltérés mellett tartalmi különbségek is mutatkoznak. A címszóállomány összeállításában természetesen irányadó a TESz. és az EWUng., a Magyar értelmező kéziszótár 2. kiadása, A magyar nyelv nagyszótárának eddig megjelent köteteiben publikált, illetőleg a későbbi kötetek számára már kijelölt címszavak listája, valamint az elektronikus nyelvi anyagokból a Magyar történeti szövegtár és a Magyar nemzeti szövegtár.

A szócikkek szerkezete és ezek főbb tartalmi elemei alapvetően megegyeznek az előzményként szolgáló szótárakéival: ez az áttekinthető struktúra jól ismert a magyar szakemberek körében. A szótár a mai (és jövőbeli) követelményeknek megfelelően természetesen elektronikusan készül. Az XML-alapú adatbázis lehetővé teszi egyrészt a szótár nagyfokú formai egységességét, másrészt a szótár teljes anyagában való gyors és sokirányú tájékozódást, harmadrészt a folyamatos frissítést.

Az ÚESz. mind digitális adathordozón (DVD-n), mind pedig hagyományos nyomtatott formában (két kötetben) is meg fog jelenni. A tervek szerint az Új magyar etimológiai szótár a közvetlen előzményként szolgáló Etymologisches Wörterbuch des Ungarischen kényszerűen szikár német nyelvezete helyett kifejtettebb, gördülékeny tudományos nyelvezeten nemcsak szakemberekhez, hanem a művelt közönséghez is szóló, gazdag anyagot tartalmazó kézikönyv lesz. Az Új magyar etimológiai szótár honlapja

Módosítva: 2020.02.25.

vissza