Research Institute for Linguistics HAS

  Research Group for Language Technology


[Magyar változat]

Home > Departments > Department of Language Technology and Applied Linguistics > Research Group for Language Technology > Staff > Bálint Sass

Bálint Sass

PhD, senior research fellow

Phone: +36 (1) 342-9372
Fax: +36 (1) 322-9297
E-mail: sass.balint[at]nytud.hu
Personal homepage: sassbalint.github.io

Fields of research

CV

Position

senior research fellow Research Institute for Linguistics HAS

Education

2011 PhD [hun], PPCU Faculty of Information Technology and Bionics, Budapest
2003 MSc, Computer Science, ELTE Faculty of Science, Budapest
2000 BSc, Computer Science, ELTE Faculty of Science, Budapest

Participation in national and international projects

2021- new Hungarian monolingual explanatory dictionary
2020-2021 Russian-Hungarian transcription of the Hungarian prisoner of war database [hun] - National Archives of Hungary, Helion Ltd.
2020 Building pretrained Hungarian language models
2019-2020 Corpus querying, corpus analysis, verb centered constructions, e-magyar - UNKP Bolyai+ scholarship
2018-2020 Multilingual Resources for CEF.AT in the legal domain (MARCELL) - EU 2017-EU-IA-0136
2017-2020 Algebraic structure of verb centered constructions - Bolyai Scholarship
2016-2018 Creating the foundation of new, innovative tourism services using NLP methods - GINOP-2.1.1-15-2015-00517
2016 New query interface for the Hungarian Historical Corpus - RIL HAS
2015-2018 Hungarian Generative Diachronic Syntax 2 - OTKA project (K 112057) external associate - corpus query interface
2015- e-magyar Digital Language Processing System for Hungarian - github - HAS infrastructure development project
2013 An online tool on Hungarian first names [hun] - RIL HAS
2012-2016 MNSZ2 - Hungarian Gigaword Corpus - CESAR, RIL HAS
2012-2015 Development of an eco-innovation marketplace based on semantic technologies (ECOINNO) - NFÜ
2012-2013 New Hungarian Contracted Braille Script - RIL HAS
2011-2013 Central and South-East European Resources (CESAR) [hun] - European Union 271022
2011-2012 Anonymization and dissemination of BSI [hun] - RIL HAS
2010-2012 iTranslate4.eu [hun] machine translation project - EU CIP-ICT-PSP.2009.5.1
2009-2013 Hungarian Generative Diachronic Syntax - OTKA project (NK 78074) associated researcher
2008-2013 helyesiras.mta.hu [hun] online spelling consultation portal - RIL HAS
2008-2010 Frequency Dictionary of Verb Phrase Constructions for Hungarian [hun] - RIL HAS
2008-2009 Corpus query interface for BSI - OTKA project (K 60403) external associate
2005-2007 Creating the Hungarian EuroWordNet ontology - GVOP project
2005 Hunglish Hungarian-English parallel corpus - ITEM project
2004-2007 Hungarian to English machine translation system - NKFP project
2004-2005 E-Szókincs [hun] - Educational aid for multi-faceted examination of the vocabulary of today's Hungarian literature - IHM project
2003-2004 Intelligent electronic dictionary and lexical database (INLEX) - ITEM project
2001-2003 Automatikuc information extraction from short (political, business, market) news - NKFP project
2001-2003 MNSZ1 - Hungarian National Corpus - OTKA project (T 026091)
2000-2002 MATCHPAD (Machine Translation for the Czech, Polish and Hungarian Public Administration) project

Courses taught

Corpus querying methods, University of Warsaw, BA, Department of Hungarian Studies – 28-30 Nov 2018
Corpus querying methods [hun], lectures given several times, ELTE and PPKE – 2018 spring, 2019 spring.
Introduction to language technology seminar, PPKE ITK – 2006 autumn, 2007 autumn.
Language technology tools and resources, PPKE ITK – 2007 spring, 2008 spring.
Other lectures: The EM algorithm, ELTE BTK, 17 Apr 2007; Language technology, PPKE ITK, 17 Oct 2007

Thesis supervision

Wolosz Márton: A lengyel igei szerkezetek számítógépes kinyerése és gyakorisági vizsgálatuk, 2013, ELTE IK, MSc
Nagy István Zoltán: A Magyar Országgyűlés plenáris üléseinek annotált korpusza, 2008, PPKE ITK, MSc

Training courses, field trips

2015 PARSEME 1st Training School on Multiword Expressions

Scholarships

2019-2020 UNKP Bolyai+ scholarship (UNKP-19-4-ELTE-840) - rating: excellent
2017-2020 Bolyai Scholarship, Hungarian Academy of Sciences (BO/00064/17/1) - rating: outstanding
2007-2010 scholarship of the Hiteles Ember Foundation

Language skills

English – B2
German – B2

Publications

If you refer to some of the publications below please inform me!

Papers

        2022
        • Sass Bálint.
          In: Acta Linguistica Academica. 69(4): 599-614.
        • Pethő Gergely, Sass Bálint, Kalivoda Ágnes, Simon László, Lipp Veronika.
          In: Berend Gábor, Gosztolya Gábor, Vincze Veronika (szerk.): MSZNY 2022, XVIII. Magyar Számítógépes Nyelvészeti Konferencia, Szegedi Tudományegyetem, Informatikai Intézet, Szeged, 77-91. [prezentáció]
        2021
        2020
        2019
        2018
        2017
        2016
        2015
        2014
        2012
        2011
        2010
        2009
        2008
        • Sass, Bálint.
          In: Sojka, P., Horák, A., Kopecek, I., Pala, K. (eds.): 11th International Conference on Text, Speech and Dialog, TSD 2008, Brno, Csehország, 2008, Proceedings. Lecture Notes in Computer Science 5246, pp. 187-192. [prezentáció]
        • Sass Bálint és Kertész Zsuzsa.
          Gyakori szókapcsolatok szövegekben.
          In: Sándor Csilla Mária (szerk): Magyar Nyelv Tanári Kincsestár, Raabe Kiadó, 2008.
        2007
        2006
        • Sass Bálint.
          In: Alexin Z., Csendes D. (szerk.): MSZNY2006, IV. Magyar Számítógépes Nyelvészeti Konferencia, SZTE, Szeged, 2006., p. 15-21. [prezentáció]
        • Simon Eszter, Farkas Richárd, Halácsy Péter, Sass Bálint, Szarvas György és Varga Dániel.
          A HunNER korpusz.
          In: Alexin Z., Csendes D. (szerk.): MSZNY2006, IV. Magyar Számítógépes Nyelvészeti Konferencia, SZTE, Szeged, 2006., p. 373-376. [prezentáció]
        • Sass, Bálint.
          In: Salakoski, T., Ginter, F., Pyysalo, S., Pahikkala, T. (eds): Advances in Natural Language Processing, 5th International Conference on NLP, FinTAL 2006, Turku, Finnország, 2006, Proceedings. Lecture Notes in Computer Science 4139, pp. 303-309. [prezentáció]
        • Sass Bálint.
          In: Heltai P.: Nyelvi modernizáció – szaknyelv, fordítás, terminológia, a MANYE 2006. évi XVI. kongresszusának kötete, MANYE – Szent István Egyetem, Pécs – Gödöllő, 2007. [prezentáció]
        2005
        • Sass Bálint.
          In: Alexin Z., Csendes D. (szerk.): MSZNY2005, III. Magyar Számítógépes Nyelvészeti Konferencia, SZTE, Szeged, 2005, p. 257-264. [prezentáció]
        • Halácsy Péter, Kornai András, Németh László, Sass Bálint, Varga Dániel, Váradi Tamás és Vonyó Attila.
          In: Alexin Z., Csendes D. (szerk.): MSZNY2005, III. Magyar Számítógépes Nyelvészeti Konferencia, SZTE, Szeged, 2005, p. 134-142.
        • Bottyán Gergely és Sass Bálint.
          Személyragos főnévi igeneves bővítményt megengedő prédikátumok kinyerése a Magyar Nemzeti Szövegtárból.
          In: Alexin Z., Csendes D. (szerk.): MSZNY2005, III. Magyar Számítógépes Nyelvészeti Konferencia, SZTE, Szeged, 2005, p. 265-266.
        • Bottyán, Gergely and Sass, Bálint.
          In: Garabík, R. (ed): Computer Treatment of Slavic and East European Languages, Third International Seminar (SLOVKO2005), Pozsony, 2005, p. 27-30.
        2004
        2003

        Conference presentations

        • Sass Bálint.
          Duplakocka, igei szerkezetek, foci.
          ELTE DiAGram, online, 2021. június 4. [prezentáció]
        • Sass Bálint.
          Hadifoglyok – magyar nevek – cirill betűk.
          Magyar Tudomány Ünnepe, online, 2020. november 19. [prezentáció]
        • Sass Bálint.
          Keresés korpuszban.
          Beszéd- és nyelvelemző szoftverek workshop, SZTE JGYPK, Szeged, 2018. október 19. [prezentáció]
        • Sass Bálint.
          Az igei szerkezetek algebrai struktúrája, avagy a duplakocka modell.
          Intézeti előadás, Budapest, MTA Nyelvtudományi Intézet, 2018. március 22. [prezentáció]
        • Sass Bálint.
          Korpuszkeresés, NoSkE, Mtsz, MNSZ2, NKP.
          Tutorial, 1. rész, Budapest, MTA Nyelvtudományi Intézet, 2016. június 1. [prezentáció]
        • Sass Bálint.
          A kibővített Magyar történeti szövegtár új keresőfelülete.
          A nyelvtörténeti kutatások újabb eredményei IX. Szeged, SZTE BTK, 2016. április 27. [prezentáció]
        • Sass Bálint.
          Korpusznyelvészet.
          Meghívott előadás, ELTE Korpusznyelvészet tárgy részeként, Budapest, ELTE BTK, 2016. április 18. [prezentáció]
        • Sass Bálint.
          Korpuszok, lekérdezők, Nemzeti Korpuszportál.
          Meghívott előadás, DHU2015 „Számítógép az irodalomtudományban” workshop, Budapest, MTA Könyvtára, 2015. november 24. [prezentáció]
        • Sass Bálint.
          Korpuszlekérdezők evolúciója.
          Magyar Tudomány Ünnepe, Budapest, MTA Székház, 2015. november 10. [prezentáció]
        • Sass Bálint.
          28 millió szintaktikailag elemzett mondat és 500000 igei szerkezet.
          NLP meetup, Budapest, 2015. április 29. [prezentáció]
        • Sass Bálint.
          Az Utónévkereső.
          Intézeti előadás, Budapest, MTA Nyelvtudományi Intézet, 2015. január 29. [prezentáció]
        • Sass Bálint.
          Verb Argument Browser – Argument Frames in the Hungarian National Corpus.
          Corpus resources for quantitative and psycholinguistic analysis workshop, Eger, 2-3 June 2014 [prezentáció]
        • Sass Bálint.
          Az Utónévkereső bemutatása.
          Magyar Tudomány Ünnepe, Budapest, MTA Székház, 2013. november 11. [prezentáció]
        • Sass Bálint.
          Az új magyar Braille-rövidírás kialakítása.
          Magyar Tudomány Ünnepe, Budapest, MTA Székház, 2013. november 11. [prezentáció]
        • Sass Bálint.
          Keresés a BUSZI-2 irányított beszélgetéseinek korpuszában.
          BUSZI bemutató, Budapest, MTA Nyelvtudományi Intézet, 2012. október 2. [prezentáció]
        • Sass Bálint.
          MNSZ – Mazsola – fordítás.
          Meghívott előadás, Fordítók és Tolmácsok Őszi Konferenciája, Budapest, 2012. szeptember 28. [prezentáció]
        • Sass Bálint.
          A Mazsola korpuszlekérdező.
          Meghívott előadás, Eötvös Collegium Angol-Amerikai Műhely, 2012. április 27. [prezentáció]
        • Sass Bálint.
          A Magyar igei szerkezetek szótár felépítése.
          Könyvbemutató, Budapest, MTA Nyelvtudományi Intézet, 2011. június 23. [prezentáció]
        • Sass Bálint.
          Egy általános modellnek megfelelő szerkezetek kinyerése korpuszból.
          Intézeti előadás, Budapest, MTA Nyelvtudományi Intézet, 2011. június 16. [prezentáció]
        • Sass Bálint.
          Primáciahatás fordítások értékelésekor.
          XIX. MAKOG, Kaposvár, 2011. január 27-29. [prezentáció]
        • Blaho Sylvia, Sass Bálint, Simon Eszter.
          A készülő MGTSz adatbázis felépítése.
          Mondattani jelenségek a Jókai-kódexben műhelykonferencia, Budapest, MTA Nyelvtudományi Intézet, 2010. február 4. [prezentáció]
        • Oravecz Csaba és Sass Bálint.
          Spontán beszélt nyelvi adatbázisok építésének technolgiai kérdései.
          Beszédkutatás 2009 konferencia, Budapest, 2009. október 16-17. [prezentáció]
        • Oravecz Csaba és Sass Bálint.
          Szöveges lejegyzésből nyelvi adatbázis.
          I. BUSZI szimpózium, Budapest, 2008. december 9. [prezentáció]
        • Sass Bálint.
          „Mazsola”
          „Gépekkel emberi nyelven” – A Nyelv- és Beszédtechnológiai Platform bemutatkozó konferenciája, Budapest, 2008. december 2. [prezentáció]
        • Sass Bálint.
          Bírálatok és konferenciák.
          Doktoranduszi szeminárium, PPKE ITK, Budapest, 2008. november 7. [prezentáció]
        • Sass Bálint.
          Eszköz a magyar igék bővítményszerkezetének vizsgálatára.
          Magyar Nyelvtudományi Társaság felolvasóülése, Budapest, 2008. május 13. [prezentáció]
        • Sass Bálint.
          Eszköz a magyar igék bővítményszerkezetének vizsgálatára.
          Nyelvész-doktoranduszok 11. Országos Konferenciája, Szeged, 2007. december 6-7. [prezentáció]
        • Sass Bálint.
          „Jóízű mazsolázás a korpuszból”
          MANYE XVII. kongresszusa, Siófok, 2007. április 19-21. [prezentáció]
        • Sass Bálint.
          Számítógépes nyelvi adatbázisok a magyarórán.
          MANYE XVI. kongresszusa, Gödöllő, 2006. április 10-12. [prezentáció]
        • Sass Bálint.
          A Magyar Nemzeti Szövegtár használata.
          MANYE vitaülés, MTA, Nyelvtudományi Intézet, Budapest, 2006. február 20. [prezentáció]
        • Sass Bálint.
          IV. Gramma Nyelvészeti Napok, Párkány, 2005. november 24-26.

         
          vissza  
        HomeDepartmentsLangtech/AppliedLanguage Techn.Staff
        Tamás VáradiVera Arató Réka Dodé Zsanett FerencziEnikő HéjaKinga Jelencsik-MátyusÁgnes KalivodaZsófia LudányiMárton MakraiIván MittelholczBálint SassEszter SimonNoémi Vadász