MTA Nyelvtudományi Intézet

  Nyelvtechnológiai Kutatócsoport


[English version]

Nyitólap > Osztályok > Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály > Nyelvtechnológiai Kutatócsoport > Projektek > MONYEK

Magyar Óvodai Beszélt Nyelvi Korpusz (MONYEK)


2011–2012
A Magyar Óvodai Nyelvi Korpusz (MONYEK) elsősorban a gyermeknyelvi variabilitás vizsgálatára jött létre, 62 darab, 4,5–5,5 éves budapesti óvodás gyermekkel készített, egyenként 20–30 perces interjúból áll. Az így létrejött korpusz hozzávetőleg 39 000 megnyilatkozásban 140 000 szót tartalmaz. A felvételek 2012 tavaszán készültek.

Minden interjú 4 különböző jellegű képről mesélő feladatot, valamint irányított és szabad társalgást tartalmaz.

Az interjúkhoz az óvodákat úgy választottuk ki (a KSH adatai alapján), hogy a szülők – feltételezhetőleg – eltérő társadalmi-gazdasági státuszúak legyenek. A korpuszban a nemek aránya kiegyenlített.

Az interjúk átírásához a Child Language Data Exchange System (CHILDES) CHAT átíró és kódoló formátumát használtuk.

A MONYEK lehetőséget nyújt más gyermeknyelvi jelenségek vizsgálatára is.
Támogató : CESAR projekt
 
  vissza  
NyitólapOsztályokNyelvtech/AlknyelvNyelvtechnológiaProjektek
MGTSZ2Finn-OTKATrendMinerSlovake.euSzlovák-magyarECOINNOBraille-rövidírásINNETMATRICAMGTSZhelyesírás.mta.huEFNILEXMedia MonitorCESARMONYEKiTranslate4.euAMICUSCLARAHuComTechBUSZI-2PlatformIgei szerkezetekCLARINCACAOTartalomelemzésMagyar WordNetGépi fordító MEOE-SzókincsEUROVOCINLEXNyelvi PortálMondatszintaxisMNSZ onlineNewsProMATCHPADMNSZCONCEDETELRIMULTEXT-EAST