Theses

Tena Perak
Semantička analiza matematičkih zadataka iskazanih riječima
Semantic Analysis of Math Word Problems
2017
Graduate
Jan Šnajder
Leon Rotim
FER
FER2
1528
49
HR
Rad opisuje simbolički pristup problemu automatiziranog rješavanja tekstnih matematičkih zadataka koji u sebi sadrže gotove formule matematičkih izraza i tekst koji pobliže opisuje način na koji ih treba rješavati. Razvijeni sustav svaku rečenicu zadatka prevodi u semantičku reprezentaciju stabla te njegovim obilaskom generira naredbe za izvršavanje od strane rješavača Photomath. Za semantičku analizu zadataka razvijena je arhitektura domensko-specifičnog jezika SML (engl. Semantic Math Language) definiranog tipovima, kontekstno-neovisnom gramatikom i transformacijskim pravilima za generiranje izlaznih naredbi. Funkcionalnost modela isprobana je na nekolicini primjera, no za valjanu evaluaciju jezik SML potrebno je nadopuniti dodatnim znanjem.
This thesis describes a symbolic approach to the problem of automatically solving math word problems containing formulae of mathematical expressions and supplement text describing the desired procedure of solving them. The system translates each sentence of the math word problem into semantical representation using trees. By traversing the trees in postorder fashion the system generates instructions for Photomath solver. For the semantic analysis of word problems an architecture of domainspecific SML language (abbr. of Semantic Math Language) is developed. The language consists of user-defined types, context-free grammar, and transformation rules for the generation of output instructions. The functionality of the model is tested on a few examples, but for its proper evaluation further work on the SML language is needed.
obrada prirodnog jezika, semantička reprezentacija, domensko-specifični jezik, tekstni matematički zadaci, Photomath
natural language processing, meaning representation, domain-specific language, math word problems, Photomath
21.9.2017.
Strojno razumijevanje matematičkih zadataka iskazanih riječima novo je i zanimljivo istraživačko područje na presjecištu obrade prirodnog jezika, ekspertnih sustava i simboličkog izračunavanja, sa značajnim primjenama u obrazovanju i podučavanju. Sa stajališta obrade prirodnog jezika, problem je posebno izazovan jer iziskuje preciznu semantičku analizu teksta koji je često vrlo kratak i koji se isprepliće s matematičkim izrazima. Jedan od izazova jest određivanje cilja zadatka, odnosno akcije koja se očekuje od onoga tko zadatak rješava. U okviru diplomskoga rada potrebno je osmisliti sustav za semantičku analizu matematičkih zadataka iskazanih riječima. Osmisliti semantički prikaz teksta zadatka i matematičkih izraza koji se u njemu pojavljuju prikladan za određivanje cilja matematičkog zadatka. Osmisliti i razviti sustav za predviđanje cilja matematičkog zadatka temeljen na pravilima, metodama statističkog strojnog učenja ili kombinaciji ovih dviju metoda. Prikupiti ili pripremiti prikladan, ručno označen skup podataka matematičkih zadataka iskazanih riječima na engleskome jeziku. Na tom skupu provesti eksperimentalno vrednovanje rada sustava te načiniti detaljnu analizu pogrešaka sustava te statističku obradu rezultata. Radu priložiti izvorni i izvršni kod razvijenog sustava, skupove podataka i programsku dokumentaciju te citirati korištenu literaturu.