Theses

Vedrana Janković
Računalni modeli distribucijske leksičke semantike hrvatskoga jezika
Computational Models of Distributional Lexical Semantics in Croatian Language
2011
Graduate
Jan Šnajder
FER
FER2
283
67
HR
Računalna semantika važna je u sustavima za obradu i razumijevanje prirodnog jezika. Distribucijski semantički modeli značenje riječi prikazuju kontekstnim vektorima u višedimenzijskom vektorskom prostoru. Nadogradnju predstavljaju modeli distribucijske semantičke složivosti, kojima je moguće modelirati semantiku višerječnih izraza. U radu su proučeni i opisani postojeći distribucijski semantički modeli i modeli semantičke složivosti te postupci njihove izgradnje i vrednovanja, s naglaskom na model nasumičnog indeksiranja. Oblikovani su, programski ostvareni i vrednovani distribucijski semantički modeli za hrvatski jezik primijenjeni na zadatak određivanja semantičke sličnosti riječi. Dodatno, oblikovani su, programski ostvareni i vrednovani distribucijski modeli semantičke složivosti za hrvatski jezik te je razmotrena njihova primjena u detekciji idioma.
Computational semantics is of high importance in systems for processing and understanding natural language. Distributional semantic models represent meanings of lexical expressions as multi-dimensional context vectors, and are upgraded to models of distributional semantic composition to model meaning of multiword expressions. In this thesis existing distributional semantic models, their construction and evaluation, with an emphasis on random indexing models, have been studied and described. Distributional semantic models for Croatian language applied to the task of semantic similarity assessment have been modeled, implemented and evaluated. Furthermore, models of distributional semantic composition have been modeled, implemented and evaluated and their application in idiom detection has been considered.
distribucijski semantički model, distribucijski model semantičke složivosti, računalna semantika, nasumično indeksiranje, hrvatski jezik
distributional semantic model, distributional semantic compositionality, computational semantics, random indexing, Croatian language
28.6.2011.
Računalna semantika ima važnu ulogu u sustavima za obradu i razumijevanje prirodnoga jezika. Distribucijski semantički modeli značenje riječi prikazuju kontekstnim vektorima u višedimenzijskom vektorskom prostoru. Nadogradnju prestavljaju modeli distribucijske semantičke složivosti, kojima je moguće modelirati semantiku višerječnih izraza. U radu je potrebno proučiti i opisati postojeće distribucijske semantičke modele i modele semantičke složivosti te postupke njihove izgradnje i vrednovanja, s naglaskom na model nasumičnog indeksiranja. Potrebno je oblikovati, programski ostvariti i vrednovati distribucijski semantički model za hrvatski jezik primijenjen na zadatak određivanja semantičke sličnosti riječi. Kao nadogradnju, potrebno je oblikovati, programski ostvariti i vrednovati semantički model složivosti za hrvatski jezik te razmotriti njegovu primjenu u detekciji idioma. Radu priložiti izvorni programski kod i ispitne uzorke.