Štatistický korektor (spell-checker)

Stránka projektu: https://slovak-text-checker.herokuapp.com/

Automatická oprava chýb v texte je založená na nástroji Korektor vyvinutom na Karlovej univerzite v Prahe [1] a na štatistických modeloch pre slovenský jazyk vytvorených zo spravodajských článkov. Princíp opravy chýb spočíva v hľadaní najpravdepodobnejšej postupnosti slov v danej vete. Na výpočet pravdepodobností sa použijú jazykové modely a chybový model. Použitím štatistickej metódy dokážeme presnejšie určiť správnu opravu chyby z pomedzi jednotlivých návrhov. Výhodou tohto riešenia je schopnosť detegovať aj chybne použité slová vo vete, ktoré sa nachádzajú v slovníku daného jazyka. Nevýhodou je nižšia úspešnosti pri oprave textov, ktorých jazykový štýl sa odlišuje od textov použitých pri trénovaní jazykových modelov.

  • Dátum: Máj 2016
  • Implementoval: O. Čičkán


Referencie:

  1. RICHER, M., STRAŇÁK, P., ROSEN, A.: Korektor – A System for Contextual Spell-checking and Diacritics Completion In Proceedings of the 24th International Conference on Computational Linguistics (Coling 2012), pp. 1-12, Mumbai, India, 2012
Späť na stránku služieb