Theses
Theses
Juraj Malenica
Predviđanje konteksta pitanja za interaktivno jezično sučelje bazi podataka
Question Context Prediction for an Interactive Natural Language Database Interface
2017
Undergraduate
Jan Šnajder
FER
FER2
5325
36
HR
Stvara se sve veća potreba za interaktivnim tekstnim sučeljima bazama podataka s praćenjem konteksta. Postojeća sučelja su prekompleksna i/ili nedovoljno učinkovita. Praćenje konteksta pomaže u rješavanju tog problema. Cilj ovog rada bio je osmisliti model za određivanje konteksta koji bi nadopunjavao nepotpune upite kao i razrješavao moguće nejasnoće pri stvaranju upita na bazu. Implementirana je struktura stabla za pohranu konteksta kao i model za pronalazak najvjerojatnijeg tumačenja danog upita za postojeći kontekst. Jezik implementacije je Python.
There is a growing need for an interactive textual language interface to databases while keeping track of context. Existing interfaces are either too complex or inefficient. Keeping track of context helps in solving this problem. The goal of this thesis was to construct a model for determining context which would complement incomplete queries and resolve possible obscurities whilst constructing database queries. A tree data structure was implemented for context storage as well as a system for finding the most probable query interpretation for a given context. The system was implemented in Python.
predviđanje konteksta, interaktivno jezično sučelje, baza podataka, prepoznavanje scenarija
context prediction, interactive language interface, database, scenario recognition
6.7.2017.
Jezično sučelje bazama podataka omogućava postavljanje upita nad bazom u kontroliranom prirodnom jeziku. Dodatnu fleksibilnost pruža mogućnost interaktivnog postavljanja upita, kod kojega se pojedini upiti nadovezuju na prethodne upite, nasljeđujući ili mijenjajući kontekst uspostavljen prethodnim upitima. Ključni korak kod interaktivnog odgovaranja na pitanja u prirodnome jeziku jest utvrditi otvara li upit novi kontekst ili se nadovezuje na postojeći. Ako se pitanje nadovezuje, potrebno je nadopuniti ili ažurirati postojeći kontekst.
Tema završnoga rada jest predikcija konteksta pitanja za interaktivno odgovaranje na pitanja nad bazom podataka o poznatim osobama na engleskome jeziku. Osmisliti postupak koji će za pitanja korisnika odrediti nadovezuje li se pitanje na prethodni kontekst na temelju analize pitanja i informacije o trenutačnom kontekstu te u slučaju višeznačnosti postaviti dodatno pitanje korisniku. Pretpostaviti da su pitanja semantički obrađena, tj. da je poznata vrsta pitanja i da su iz pitanja ekstrahirane relevantne informacije potrebne za generiranje upita nad bazom podataka. Izgraditi prikladnu ispitnu bazu semantički obrađenih pitanja u prirodnome jeziku grupiranih u interaktivne sjednice. Provesti vrednovanje modela, usporedbe s referentnim modelom, statističku obradu rezultata te analizu pogrešaka. Radu priložiti izvorni i izvršni kod razvijenog sustava, označene skupove podataka i potrebnu dokumentaciju te citirati korištenu literaturu.