Kálmán László (MTA NYTI)

A szófajok automatikus felfedezésének nehézségei

 

2018. május 8., 14.00

MTA Nyelvtudományi Intézet (Bp VI., Teréz krt. 13.), 108-as elõadó

 

 

A hagyományos és modernebb nyelvtanok szerint a mondat- és szószerkezetek lényege az, hogy milyen szófajú („morfoszintaktikai kategóriájú”) szavak jöhetnek egymás után. Ha ez jó megközelítés lenne, akkor nem okozna különösebb nehézséget a szavak szófajának automatikus felismerése szövegek elemzésével. De, mint beszámolok róla, ennek a feladatnak a megoldása mindeddig gyakorlatilag sikertelen volt. Ráadásul már a múlt században tudták, hogy nem is lehet sikeres. A negatív eredmények értékelése után megpróbálom megmagyarázni, hogyan közelíthetjük meg fordítva a problémát: A szó- és mondatszerkezetek különbözõ formai és jelentéstani sajátosságainak következménye, nem pedig oka az, hogy úgy érezzük, a szavak jól-rosszul különféle csoportokba sorolhatók.