Theses

Ognjen Lajšić
Strojna provjera gramatike i stila i tekstovima na hrvatskome jeziku
Grammar and Style Checker for Croatian Language
2011
Graduate
Jan Šnajder
FER
FER2
286
49
HR
U tekstovima formalna karaktera zahtijeva se jezična ispravnost, što podrazumijeva usklađenost s gramatičkom, pravopisnom i rječničkom normom standardnoga jezika. Osim toga, pri pisanju takvih tekstova potrebno je i poštivati odlika dobra stila, koje se s obzirom na svrhu teksta mogu razlikovati. U izbjegavanju jezičnih pogrešaka pomoći nam mogu pravopisni, gramatički i stilski provjernici, no od provjernika koji podržavaju hrvatski jezik dostupni su zasada samo pravopisni. U okviru ovoga rada dan je pregled postupaka za ispravljanje gramatičkih i stilskih pogrešaka i iznesena je tipologija jezičnih pogrešaka u pisanju. Razrađeni su i iskušani postupci temeljeni na statistici i na pravilima namijenjeni pronalaženju gramatičkih i stilskih pogrešaka u tekstovima na hrvatskome jeziku. Ti su postupci opisani te su izneseni i komentirani rezultati njihova vrednovanja.
In various occasions it is required to produce texts that are written in formal style and that are correct regarding their spelling and grammar. There are several types of computer programs that can help us avoid language errors — namely spelling, grammar and style checkers — but there are no grammar and style checkers available for Croatian language. This paper gives an overview of techniques for correcting grammar and style mistakes and presents a typology of language errors in Croatian texts. Various statistical and rule-based techniques have been developed and described. Those techniques have also been evaluated and the results of the evaluation are presented and discussed.
gramaticki i stilski provjernik, pristup temeljen na statistici i pravilima, n-grami, jezični model
grammar & style checker, statistical and rule-based approach, ngrams, language model
27.6.2011.