Pravidlový lematizátor (Tvaroslovník)

Stránka projektu: http://text.fiit.stuba.sk/lemmatizer

Lematizácia na základe pravidiel podľa článku z UPJŠ v Košiciach [1]. Pravidlá sú založené na pozorovaní, že ze na ohýbanie slovenského slova má najväčší vplyv jeho koniec (sufix). Ten sa použije na výber šablóny, podľa ktorej sa upraví vstupné slovo. Nevýhodou tejto služby sú nepresnosti spôsobené prípadným nesprávnym výberom vhodnej šablóny. Výhodou je možnosť lematizácie všetkých slov, aj takých, ktoré nie sú v nejakom slovníku (nové slová, cudzie slová, ...).

  • Dátum: Apríl 2013
  • Implementoval: R. Horváth


Referencie:

  1. KRAJČÍ, S., NOVOTNÝ, R.: Hľadanie základného tvaru slovenského slova na základe spoločného konca slov. In: 1st Workshop on Intelligent and Knowledge oriented Technologies, Institute of Informatics SAS, 2007, s. 99-101.
Späť na stránku služieb