Theses

Student

Bruno Gavranović

Title HR

Primjena dubokog učenja na analizu sentimenta

Title EN

Application of Deep Learning for Sentiment Analysis

Year

2016

Level

Undergraduate

Supervisor

Jan Šnajder

Co-supervisor

Hands-on assistant

Martin Tutek

Study Programme

FER

Programme

FER2

Thesis ID

4752

Number of pages

Language

Abstract HR

Uzevši u obzir eksponencijalnni rast dostupnih podataka generiranih u cijelom svijetu, postoji rastući interes u stvaranje modela sposobnih za analizu podataka koji imaju semantički nepoznat kontekst. Ovaj rad se fokusira na istraživanje i analizu teorijske osnove koja stoji iza modela zvanih povratne neuronske mreže (engl. recurrent neural networks, RNN) kroz konkretnu implementaciju na problemu semantičke analize. Poseban slučaj povratnih neuronskih mreža, mreže s dugotrajnim kratkoročnim pamćenjem (engl. Long short-term memory networks, LSTM) su implementirane na problemu klasifikacije sentimenata na skupu podataka recenzija filmova. Testirane su i uspoređene mnogobrojne arhitekture i konfiguracije hiperparametara spomenutih neuronskih mreža. Značajano poboljšanje performansi je primjećeno s dubokim višeslojnim LSTM mrežama, u za razliku od rezultata dobivenih s plitkim mrežama.

Abstract EN

Given the exponential growth of amount of available data generated worldwide, there has been a rising interest in the creation of models capable of analyzing the data without knowing the semantic context. This paper focuses on exploration and analysis of the theoretical foundation that stands behind models called recurrent neural networks through concrete implementation on a problem of semantic analysis. Special case of recurrent neural networks, long short-term memory networks (LSTM networks) were implemented on a task of semantic classification on the IMDb dataset. Various architectures and hyperparameter configurations were tested and compared on the said neural networks. Significant performance boost was detected with deep multi-layer LSTM networks, compared to performance with shallow ones.

Keywords HR

obrada prirodnog jezika, strojno učenje, neuronske mreže, duboko učenje, analiza sentimenata, LSTM, povratne neuronske mreže

Keywords EN

natural language processing, machine learning, neural networks, deep learning, sentiment analysis, LSTM, recurrent neural networks

Defense date

6.7.2016.

Thesis task HR

Duboko učenje naziv je za skup algoritama strojnoga učenja koji kroz višeslojnu obradu podataka modeliraju apstrakcije visoke razine. Ti su se modeli pokazali iznimno učinkoviti na nizu zadataka obrade prirodnog jezika. To se posebno odnosi na metode temeljene na povratnim neuronskim mrežama, koje se u posljednje vrijeme preuzele vodstvo nad tradicionalnim pristupima u analizi teksta. U okviru završnoga rada potrebno je upoznati se s osnovama neuronskih mreža, a zatim proučiti modele dubokog učenja temeljene na tradicionalnim povratnim neuronskim mrežama (eng. recurrent neural networks, RNN), modele dugog kratkoročnog pamćenja (engl. long short term memory, LSTM) te modele s propusnim povratnim jedinicama (gated recurrent units, GRU). Upoznati se s problemom analize sentimenta u korisnički generiranom sadržaju. Razviti i implementirati model za analizu sentimenta temeljen na dubokom učenju te ga primijeniti na prikladne skupove podataka na hrvatskome i engleskome jeziku. Provesti eksperimentalno vrednovanje modela, uključivo usporedbu s referentnim modelom i statističku obradu rezultata. Radu priložiti izvorni i izvršni kod razvijenog sustava, označene skupove podataka i potrebnu dokumentaciju te citirati korištenu literaturu.

Thesis task EN

Publicly available

Published paper(s)

File

TakeLab-ZR-2016-BrunoGavranovic.pdf