Starting Page > Departments > Department of Language Technology and Sociolinguistics > Research Group for Language Technology > Tamás Váradi

 

Tamás Váradi

 

Ph.D., deputy director, chair of the Department of Language Technology and Sociolinguistics

 

Tel.: (36-1) 321-4830/126
Fax: (36-1) 321-4830/146, (36-1) 322-9297
E-mail: varadi[kukac]nytud.hu

Fields of research

 • language technology (corpus linguistics, shallow parsing, lexical databases, machine translation)
 • sociolinguistics
 • foreign language aquisition

CV

Position

senior research fellow, chair, deputy director Research Institute for Linguistics, Hungarian Academy of Sciences

Education

1996 Ph.D. - English linguistics
1982 Dr. univ. - English linguistics
1970-1976 Eötvös Loránd University, Faculty of arts, English, Spanish, General and Applied Linguistics

Professional activity

2007- deputy director, Research Institute for Linguistics, Hungarian Academy of Sciences
1997- senior research fellow, Head of Department, Research Institute for Linguistics, Hungarian Academy of Sciences
1995-1997 research fellow, Research Institute for Linguistics, Hungarian Academy of Sciences
1991-1995 lecturer at the Department of Slavonic and East-European Studies, London University, England
1990-1991 Tempus scholarship Lancaster University, England
1987- research fellow, Hungarian Academy of Sciences
1983-1986 Trainee Scholarship, Hungarian Academy of Sciences
1973-1983 associate professor, former Budapest Business School

Coordination of national and international projects

2011- CESAR Central and South-East European Language Resources - EU CIP-ICT-PSP.2010.6.1
2010- iTranslate4.eu machine translation for all European languages - EU CIP-ICT-PSP.2009.5.1
2008- CLARIN Common Language Resources and Technology infrastructure- EU FP7 INFRA-2007-2.2.01
2008-2009 CACAO Cross-Language Access to Catalogues and On-Line Libraries - EU ECP 2006 DILI 310035
2006-2008 Nemzeti és etnikai identitás vizsgálata történelmi eseményekre vonatkozó szövegek narratív alakzatainak számítógépes tartalomelemzése révén - NKFP projekt
2005-2007 Building of the Hungarian onthology (EuroWordnet) GVOP project
2004-2006 Hungarian Unified Ontology - NKFP projekt
2004-2006 Machine tranlsation system for language pair: Hungarian-English - NKFP project
2003-2004 Intelligent electronic dictionary and lexical database - ITEM projekt
2002-2003 Machine learning of the syntax of sentences - OKTA projekt
2001-2003 Authomatic information extraction from short (political, business, market) news - NKFP projekt
2000-2002 MATCHPAD (Machine Translation for the Czech, Polish and Hungarian Public Administration) project
1998-2000 CONCEDE (Consortium for Central European Dictionary Encoding) - COPERNICUS project
1997- TELRI (Trans European Language Resources Infrastructure) project
1995-1998 MULTEXT-EAST (Multilingual Text Tools and Corpora) - COPERNICUS project

Languages

English - C1
Spanish - C1

Publications

 • Váradi T, Héja E.
  Szaknyelv és korpusznyelvészet.
  In: Dobos Cs., (szerk): Szaknyelvi kommunikáció (Segédkönyvek a nyelvészet tanulmányozásához 110.), Tinta Könyvkiadó, 2010, pp. 107-125.
 • Gábor, K., Héja E., Kuti J., Nagy V., Váradi T.
  A lexikon a nyelvtechnológiában.
  In: Kiefer Ferenc (szerk.) Strukturális magyar nyelvtan IV. A lexikon szerkezete. Akadémiai Kiadó, Budapest, 2008, p. 853-893.
 • Váradi T.
  NP Modification Structures in Parallel Corpora.
  New Trends in Translation Studies. In honour of Kinga Klaudy (szerk.: Károly K, Fóris Á) Akadémiai Kiadó, Budapest, 2005, pp 191-206
 • Váradi T.
  Taking Stock of the Bilingual Lexicon.
  Corpus Linguistics 2005. Proceedings of the Conference, Vol. Birmingham, 2005.
 • Sass B, Váradi T.
  A hunglish korpusz és szótár.
  III. Magyar számítógépes nyelvészeti konferencia (szerk.: Alexin Z, Csendes D) SZTE, Szeged, 2005, pp 134-142
 • Váradi T.
  Többszavas kifejezések kezelése MT szótárban.
  III. Magyar számítógépes nyelvészeti konferencia (szerk.: Alexin Z, Csendes D) SZTE, Szeged, 2005, pp 233-244
 • Váradi T, Gábor K.
  A magyar Intex fejlesztéséről.
  Magyar Számítógépes Nyelvészeti Konferencia 2 (szerk.: Alexin Z, Csendes D) Szegedi Tudományegyetem, 2004, pp 3-10
 • Váradi T (szerk.).
  Magyar Nemzeti Szövegtár.
  MTA Nyelvtudományi Intézet, Budapest, 2004, p.
 • Váradi T. (szerk.)
  Magyar Történeti Korpusz.
  MTA Nyelvtudományi Intézet, Budapest, 2004, p.
 • Pusztai F, Gerstner K, Juhász J, Kemény G, Szőke I, Váradi T. (szerk.)
  Magyar értelmező kéziszótár.
  Akadémiai Kiadó, Budapest, 2003, p. 1507
 • Váradi T.
  A Budapesti Szociolingvisztikai Interjú.
  A magyar nyelv kézikönyve (szerk.: Kiefer F, Siptár P) Akadémiai Kiadó, Budapest, 2003, pp 339-359
 • Váradi T.
  Shallow Parsing of Hungarian Business News.
  Proceedings of the Corpus Linguistics 2003 ConferenceCorpus Linguistics 2003 Conference, Lancaster, 2003, pp 845-851
 • Váradi T.
  Főnévi csoportok annotálása a ClaRK rendszerben.
  Magyar Számítógépes Nyelvészeti Konferencia 2003 (szerk.: Alexin Z, Csendes D) SZTE, Szeged, 2003, pp 65-71
 • Váradi T, Csendes D, Hatvani Cs., Alexin Z, Csirik J, Gyimóthy T, Prószéky G.
  Kézzel annotált magyar nyelvi korpusz: a Szeged Korpusz.
  Magyar Számítógépes Nyelvészeti Konferencia 2003 (szerk.: Alexin Z, Csendes D) SZTE, Szeged, 2003, pp 238-246
 • Olaszy G, Váradi T, Prószéky G.
  Nyelvtechnológia.
  A magyar nyelv kézikönyve (szerk.: Kiefer F, Siptár P) Akadémiai Kiadó, Budapest, 2003, pp 567-588
 • Senellart J, Dienes P, Váradi T. (szerk.)
  Development of a New Generation of Translation System.
  In Proceedings of MT Summit VIII. Santiago, 2001 September, Santiago de Compostela, Santiago, 2001, p. 8
 • Erjavec T, Váradi T.
  The TELRI tool catalogue: structure and prospects.
  Proceedings of the ACL 2001 Workshop on Sharing Tools and Resources. Toulouse, 2001ACL, Toulouse, 2001, pp 6-11
 • Váradi T.
  The Linguistic Relevance of Corpus Linguistics.
  Proceedings of the Corpus Linguistics 2001 Conference, Lancaster, 2001 (szerk.: Rayson P, Wilson A, McEnery T, Hardie A, Khoja S) Lancaster University, Lancaster, 2001, pp 587-594
 • Váradi T, Kiss G.
  Equivalence and Non-equivalence in Parallel Corpora.
  INTERNATIONAL JOURNAL OF CORPUS LINGUISTICS., 6 : 167-177 (2001)
 • Váradi T.
  Kontrasztív szemantikai kutatások párhuzamos korpusz segítségével.
  Kontrasztív szemantikai kutatások (szerk.: Gecső T) Tinta, Budapest, 2001, pp 254-261
 • Váradi T.
  Fishing for Translation Equivalents Using Grammatical Anchors.
  INTERNATIONAL JOURNAL OF CORPUS LINGUISTICS., 5 (1) : 1-16 (2000)
 • Tufis D, Dienes P, Oravecz Cs., Váradi T.
  Principled Hidden Tagset Design for Tiered Tagging of Hungarian.
  LREC2000, Proceedings of the Second International Conference on Language Resources and Evaluation (szerk.: Gavrilidou M) ELRA, 2000, pp 1421-1426
 • Váradi T.
  Corpus Linguistics - Linguistics or Language Engineering?
  Proceedings of the conference Language Technologies 2000 (szerk.: Erjavec T, Gros J) Institut Jozef Stefan, Ljubljana, 2000, pp 1-5
 • Váradi T.
  Lexical and Translation Equivalence in Parallel Corpora.
  LREC2000, Proceedings of the Second International Conference on Language Resources and Evaluation (szerk.: Gavrilidou M) ELRA, 2000, pp 539-543
 • Váradi T.
  Modern nyelvi technológiák a magyar nyelvért.
  Helyzetkép a magyar nyelvtudományról (szerk.: Kiefer F, Gósy M) MTA Nyelvtudományi Intézete, Budapest, 2000, pp 146-156
 • Váradi T.
  Szótár, korpusz - Magyar nemzeti szövegtár.
  Lexikális jelentés - aktuális jelentés (szerk.: Gecső T) Tinta Könyvkiadó, Budapest, 2000, pp 263-270
 • Váradi T.
  The Hungarian National Corpus.
  Proceedings of the Third International Conference on Language Resources and Evaluation (LREC-2002) Las Palmas de Gran Canaria: European Language Resources Association, 2002, pp 385-389
 • Alexin Z, Váradi T, Oravecz Cs., Prószéky G, Csirik J, Gyimóthy T.
  FGT - A framework for generating rule-based taggers.
  ILP-99, Late-Breaking papers, Bled, 1999 (szerk.: Dzeroski S, Flach P) Josef Stefan Institute, Ljubljana, 1999, pp 1-7
 • Erjavec T, Tufis D, Váradi T.
  Developing TEI-Conformant Lexical Databases for CEE Languages.
  Papers in Computational Lexicography, Complex'99. Budapest, 1999 (szerk.: Kiefer F, Kiss G, Pajzs J) MTA Nyelvtudományi Intézete, Budapest, 1999, pp 205-211
 • Oravecz Cs., Váradi T.
  TEI Encoding of the Hungarian Explanatory Manual Dictionary.
  Papers in Computational Lexicography, Complex'99. Budapest, 1999 (szerk.: Kiefer F, Kiss G, Pajzs J) MTA Nyelvtudományi Intézet, Budapest, 1999, pp 229-236
 • Váradi T.
  On developing the Hungarian national corpus.
  Proceedings of the Workshop Language Technologies - Multilingual Aspects. 32nd Annual Meeting of the Societas Linguistica Europea. Ljubljana, 1999 (szerk.: Vintar S) Department of Translation and Interpreting, University of Ljubljana, Ljubljana, 1999, pp 57-63
 • Váradi T, Oravecz Cs.
  Morphosyntactic ambiguity and tagset design for Hungarian.
  Proceedings of the Workshop on Linguistically Interpreted Corpora, EACL'99. Bergen, 1999 (szerk.: Brants T) Association for Computational Linguistics, ACL, Bergen, 1999, pp 8-22
 • Bátori I, Németh K, Váradi T.
  Computerwekzeuge für die Sprachforschung: Aufbau und Funktionen einer etymologischen Datenbasis für den gemeinsamen uralischen Wortbestand.
  STUDIA IRANICA, MESOPOTAMICA, ANATOLICA, 27 (3) : 3-14 (1998)
 • Váradi T.
  On the Spoken Corpus of the Budapest Sociolinguistic Interview.
  Proceedings of the Workshop on Speech Database Development for Central and Eastern European Languages, Granada, 1998 (szerk.: Roach P) ELRA, 1998, pp 47-52
 • Váradi T.
  From cards to computer files: Processing the data of the Budapest sociolinguistic interview.
  In: Working Papers in Hungarian Sociolinguistics, No. 3. MTA Nyelvtudományi Intézete, Budapest, 1998, p. 56
 • Váradi T.
  Manual of the Budapest Sociolinguistic Interview Data.
  In: Working Papers in Hungarian Sociolinguistics, No. 4. MTA Nyelvtudományi Intézete, Budapest, 1998, p. 99
 • Kontra M, Váradi T.
  The Budapest Sociolinguistic Interview: Version 3.
  In: Working Papers in Hungarian Sociolinguistics, No. 2. MTA Nyelvtudományi Intézete, Budapest, 1997, p. 101
 • Váradi T.
  Adatok a nagyszótári korpusz összetételéről.
  Szavak - nevek - szótárak. Írások Kiss Lajos 75. születésnapjára (szerk.: Kiss G, Zaicz G) MTA Nyelvtudományi Intézete, Budapest, 1997, pp 437-447
 • Pajzs J, Váradi T.
  A magyar irodalmi és köznyelv nagyszótárának korpusza a HUNGARNET közösség számára.
  Networkshop 97 konferencia. Keszthely, 1997 május 27-29. (CD-ROM) IIF Programiroda, Budapest, 1997, pp X
 • Csernicskó I, Váradi T. (szerk.)
  Kisebbségi magyar iskolai nyelvhasználat.
  Tinta Könyvkiadó, Budapest, 1996, p. 102
 • Váradi T.
  Stylistic variation and the (bVn) variable in the Budapest Sociolinguistic Interview.
  ACTA LINGUISTICA HUNGARICA, 43 : 295-309 (1996)
 • Váradi T, Kontra M.
  Degrees of stigmatization: t-final verbs in Hungarian.
  ZDL-Beiheft 77. Verhandlungen des Internationalen Dialektologenkongresses. Bd. 4. Bamberg, 1990 (szerk.: Viereck W) Franz Steiner, Stuttgart, 1995, pp 132-142
 • Váradi T.
  Hesitations between inessive and illative forms in Hungarian.
  Studies in apllied linguistics 1. (szerk.: Hunyadi L, Kontra M, Pléh Cs.) KLTE, Debrecen, 1994, pp 3-20
 • Váradi T.
  A nyelvhasználat empirikus vizsgálatáról.
  Színes eszmék nem alszanak... (szerk.: Andor J, Szűcs T, Terts I) Lingua Franca, Pécs, 1993, pp 1285-1291
 • Kontra M, Váradi T. (szerk.)
  Studies in Spoken Languages: English, German, Finno-Ugric
  MTA Nyelvtudományi Intézet, Budapest, 1992, p. 130
 • Váradi T.
  Communication strategies.
  APPLIED LINGUISTICS., 13 (4) : 434-440 (1992)

 

Last modified: 25.02.2011.

 Back