Theses

Ivan Paljak
Klasifikacija i analiza stavova u korisničkim komentarima na internetu
Stance Classification and Analysis in Online User Comments
2015
Undergraduate
Jan Šnajder
Domagoj Alagić
FER
FER2
4273
44
HR
Korisnički komentari na internetu vrijedan su izvor informacija za analizu stavova i mi2ljenja ljudi o doga_x009e_đajima i njihovim protagonistima, političkim odlukama i političkim subjektima, ideološkim pitanjima, kontroverznim temama itd. Računalna analiza stavova razmjerno je novo područje u okviru analize prirodnog jezika koje se bavi automatskom klasifikacijom i analizom stavova izraženih u tekstu, primjerice korisničkih komentara na internetu. Riječ je o posebno izazovnom zadatku, dodatno otežanom zbog vrlo niske jezične kvalitete korisničkih komentara. Problemu klasifikacije u okviru završnog rada pristupili smo metodom potpornih vektora, dok smo analizi korisničkih komentara, odnosno, rudarenju argumenata pristupili algoritmom Markovljevog grupiranja.
Online user comments are a valuable source of information on public's opinions regarding certain events and their protagonists, political decisions and subjects, ideological questions, controversial subjects etc. Computational stance analysis is a relatively new field of natural language processing which deals with automatic classification and analysis of stance expressed in texts, such as user generated online comments. In this paper, the classification part of the problem was solved using support vector machines, whereas the analysis part was tackled by Markov clustering algorithm.
obrada prirodnog jezika, strojno učenje, umjetna inteligencija, metoda potpornih vektora, Markovljevo grupiranje, hrvatski jezik, internet komentar
natural language processing, machine learning, artificial intelligence, support vector machine, Markov clustering algorithm, Croatian language, online comment
7.7.2015.
Korisnički komentari na internetu vrijedan su izvor informacija za analizu stavova i mišljenja ljudi o događajima i njihovim protagonistima, političkim odlukama i političkim subjektima, ideološkim pitanjima, kontroverznim temama itd. Računalna analiza stavova razmjerno je novo područje u okviru analize sentimenta koje se bavi automatskom klasifikacijom i analizom stavova izraženih u tekstu, primjerice korisničkih komentara na internetu. Riječ je o posebno izazovnom zadatku, dodatno otežanom zbog vrlo niske jezične kvalitete korisničkih komentara. U okviru završnoga rada potrebno je proučiti pristupe za automatsku klasifikaciju stavova, s naglaskom na pristupe temeljene na strojnom učenju. Osmisliti model za klasifikaciju i analizu stavova korisničkih komentara na hrvatskome jeziku. Pored klasifikacije stavova, model treba omogućiti grubu analizu stavova u okviru odabrane teme u vidu jednostavne analiza glavnih argumenata kojima korisnici potkrjepljuju svoje stavove. Izgraditi odgovarajući skup tekstnih podataka na hrvatskome jeziku za razvoj i ispitivanje modela. Razviti programsku implementaciju modela i primijeniti ga na korisničke komentare na hrvatskome jeziku za neke odabrane teme. Provesti iscrpno vrednovanje modela, usporedbu s referentim modelom, statističku obradu rezultata te analizu pogrešaka. Radu priložiti izvorni i izvršni kod razvijenog sustava, označene skupove podataka i potrebnu dokumentaciju te citirati korištenu literaturu.