Nyelvtechnológiai Kutatócsoport |
||||||||||||
Nyitólap > Osztályok > Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály > Nyelvtechnológiai Kutatócsoport > Projektek > MONYEK Magyar Óvodai Beszélt Nyelvi Korpusz (MONYEK) 2011–2012
A Magyar Óvodai Nyelvi Korpusz (MONYEK) elsősorban a gyermeknyelvi variabilitás vizsgálatára jött létre, 62 darab, 4,5–5,5 éves budapesti óvodás gyermekkel készített, egyenként 20–30 perces interjúból áll. Az így létrejött korpusz hozzávetőleg 39 000 megnyilatkozásban 140 000 szót tartalmaz. A felvételek 2012 tavaszán készültek.
Támogató :
CESAR projekt
Minden interjú 4 különböző jellegű képről mesélő feladatot, valamint irányított és szabad társalgást tartalmaz. Az interjúkhoz az óvodákat úgy választottuk ki (a KSH adatai alapján), hogy a szülők – feltételezhetőleg – eltérő társadalmi-gazdasági státuszúak legyenek. A korpuszban a nemek aránya kiegyenlített. Az interjúk átírásához a Child Language Data Exchange System (CHILDES) CHAT átíró és kódoló formátumát használtuk. A MONYEK lehetőséget nyújt más gyermeknyelvi jelenségek vizsgálatára is.
|
NyitólapOsztályokNyelvtech/AlknyelvNyelvtechnológiaProjektek MGTSZ2Finn-OTKATrendMinerSlovake.euSzlovák-magyarECOINNOBraille-rövidírásINNETMATRICAMGTSZhelyesírás.mta.huEFNILEXMedia MonitorCESARiTranslate4.euAMICUSCLARAHuComTechBUSZI-2PlatformIgei szerkezetekCLARINCACAOTartalomelemzésMagyar WordNetGépi fordító MEOE-SzókincsEUROVOCINLEXNyelvi PortálMondatszintaxisMNSZ onlineNewsProMATCHPADMNSZCONCEDETELRIMULTEXT-EAST |