Štatistický diakritikovač

Stránka projektu: http://text.fiit.stuba.sk:8081/

Nástroj doplňujúci diakritiku do slovenského textu, ktorý diakritiku neobsahuje [1]. Pri rekonštrukcií sa vychádza z kontextu. Využíva sa jazykový model slovenčiny, ktorý bol vytvorený na JÚĽŠ SAV v Bratislave [2]. Úspešnosť rekonštrukcie sa pohybuje nad úrovňou 98%. Diakritika je doplnená len do gramaticky správne napísaných slov. Slová s preklepmi nie sú rekonštruované.

Diakritikovač je dostupný aj vo forme rozšírenia pre webový prehliadač Chrome v Chrome store. Text označený v prehliadači (text emailu, príspevok na fóre, a pod.) sa po použití rozšírenia rekonštruuje. Je potrebné povoliť skripty z neoverených zdrojov.

  • Dátum: Jún 2015
  • Implementoval: J. Gedera


Referencie:

  1. GEDERA, J.: Diakritikovač slovenského textu. Vedúci práce: Dr. Marián Šimko. Bakalárska práca. Fakulta informatiky a informačných technológií STU v Bratislave. Bratislava, 2015, 35s
  2. JÚĽŠ SAV: Slovenský národný korpus – prim-6.1-public-all. Bratislava: Jazykovedný ústav Ľ. Štúra SAV 2013. Dostupný z WWW: http://korpus.juls.savba.sk.
Späť na stránku služieb