Theses

Bartol Freškura
Primjena modela dubokog učenja za otkrivanje stavova u korisničkim komentarima
Application of Deep Learning for Stance Detection in User Comments
2016
Undergraduate
Jan Šnajder
Martin Tutek
FER
FER2
4751
49
HR
Duboko učenje je relativno nova grana strojnog učenja koja se temelji na teoriji neuronskih mreža. Pomo ́cu naprednih arhitektura dubokih neuronskih mreža danas se pokušavaju riješiti poznati problemi u području obrade prirodnog jezika kao što su analiza stavova i sentimenta. U sklopu završnog rada napravljene su dvije poznate konfiguracije povratnih neuronskih mreža LSTM i GRU pomoću programa Tensorflow. Provedeni su razni eksperimenti u kojima se traže optimalni parametri povratnih neuronskih mreža s ciljem točne klasifikacije stavova u korisničkim komentarima iz skupova podataka na hrvatskom i engleskom jeziku.
Deep learning is a relatively new branch of machine learning based on the theory of neural networks. Using the advanced deep neural network architectures, today’s well-known natural language processing problems like sentiment and opinion mining are being solved. Two widely used configurations of recurrent neural networks were created with the Tensorflow software: LSTM and GRU. Many different experiments were conducted in which the focus was on finding the optimal parameters of the recurrent neural networks, which would yield in correct stance classification of user comments from the Croatian and English datasets.
umjetna neuronska mreža, duboko učenje, LSTM, GRU, strojno učenje, obrada prirodnog jezika
artificial neural network, deep learning, LSTM, GRU, machine learning, natural language processing
5.7.2016.
Duboko učenje naziv je za skup algoritama strojnoga učenja koji kroz višeslojnu obradu podataka modeliraju apstrakcije visoke razine. Ti su se modeli pokazali iznimno učinkoviti na nizu zadataka obrade prirodnog jezika, uključivo analizi sentimenta. Otkrivanje stavova novo je i izazovno područje u okviru analize sentimenta koje se bavi automatskom klasifikacijom i analizom stavova izraženih u tekstu, primjerice korisničkih komentara na internetu. U okviru završnoga rada potrebno je upoznati se s osnovama neuronskih mreža, a zatim proučiti modele dubokog učenja temeljene na tradicionalnim povratnim neuronskim mrežama (eng. recurrent neural networks, RNN), modele dugog kratkoročnog pamćenja (engl. long short term memory, LSTM) te modele s propusnim povratnim jedinicama (gated recurrent units, GRU). Upoznati se s problemom analize stavova u korisnički generiranom sadržaju. Razviti i implementirati model za analizu sentimenta temeljen na dubokom učenju te ga primijeniti na prikladne skupove podataka na hrvatskome i engleskome jeziku. Provesti eksperimentalno vrednovanje modela, uključivo usporedbu s referentnim modelom i statističku obradu rezultata. Radu priložiti izvorni i izvršni kod razvijenog sustava, označene skupove podataka i potrebnu dokumentaciju te citirati korištenu literaturu.