Kálmán László (MTA NYTI)
A szófajok automatikus felfedezésének nehézségei
2018. május 8., 14.00
MTA Nyelvtudományi Intézet (Bp VI., Teréz krt. 13.), 108-as elõadó
A hagyományos és modernebb nyelvtanok szerint a mondat- és szószerkezetek lényege az, hogy milyen szófajú (morfoszintaktikai kategóriájú) szavak jöhetnek egymás után. Ha ez jó megközelítés lenne, akkor nem okozna különösebb nehézséget a szavak szófajának automatikus felismerése szövegek elemzésével. De, mint beszámolok róla, ennek a feladatnak a megoldása mindeddig gyakorlatilag sikertelen volt. Ráadásul már a múlt században tudták, hogy nem is lehet sikeres. A negatív eredmények értékelése után megpróbálom megmagyarázni, hogyan közelíthetjük meg fordítva a problémát: A szó- és mondatszerkezetek különbözõ formai és jelentéstani sajátosságainak következménye, nem pedig oka az, hogy úgy érezzük, a szavak jól-rosszul különféle csoportokba sorolhatók.