Back to Search Start Over

The Effect of Word Representation Methods on Aspect-Based Sentiment Analysis

Authors :
TUNA, Murat Fatih
Source :
Volume: 15, Issue: 4 443-452, Journal of Information Technologies, Bilişim Teknolojileri Dergisi
Publication Year :
Publisher :
Gazi Üniversitesi, 2022.


Klasik duygu analizi yöntemlerinden farklı olarak hedef tabanlı duygu analizi (HTDA), birden fazla kategorinin olduğu karmaşık yapıdaki çevrimiçi tüketici geribildirimlerini değerlendirmede daha başarılı bir performans ortaya koyabilmektedir. Nitekim bir platformda yer alan tüketici geri bildirimleri bir ürüne ilişkin birden farklı hedefe atfedilebilmektedir ve standart duygu analizleri bu geribildirimleri analiz etmede yetersiz kalmaktadır. Literatürdeki gelişmeler gözden geçirildiğinde, HDTA çalışmalarının, duygu analizine odaklanan diğer çalışmalar içinde oldukça popüler olduğu anlaşılmaktadır. SemEval ABSA-2016 yarışmasında, HTDA için 8 farklı dilde veri setleri yayınlanmış ve ekipler duygu analizi için yarışmışlardır. Yarışmada hedef terim, kategori ve duygu sınıfı tespit etmek gibi farklı alt görevler bulunmaktadır. Bu alt görevlerin içindekilerden biri, hedef terimin tespit edilmesidir. Türkçe dili için HTDA çalışmaları oldukça sınırlıdır. Farklı diller ve farklı kelime temsil yöntemleri kullanan çalışmalar vardır. SemEval Absa 2016 yarışması Türkçe veri seti için kelime temsil yöntemlerinin etkisini inceleyen çalışma bulunmamaktadır. Bu çalışma, müşteri yorumlarındaki hedef terimlerin tespitinde farklı kelime temsil yöntemlerinin başarısının incelenmesi amacıyla gerçekleştirilmiştir. Word2Vec, Glove ve Fasttext kelime temsil yöntemleri analiz kapsamında incelenmiş ve hedef terimi en başarılı tespit edebilen yöntemin Fasttext kelime temsil yöntemi olduğu görülmüştür. Çalışmada ayrıca F-1 sınıflandırma ölçütü açısından %77 başarı oranı ile Türkçe veri seti için literatürdeki en yüksek sınıflandırma başarısı elde edilmiştir.<br />Unlike classical sentiment analysis methods, Aspect-Based Sentiment Analysis (ABSA) can demonstrate a more successful performance in evaluating complex online consumer feedbacks including more than one category. As a matter of fact, consumer feedbacks on a platform can be referred to more than one aspect regarding a product, and standard sentiment analysis method is insufficient to analyse these comments. When the developments in the literature are reviewed, it is understood that HDTA studies are very popular among other studies focusing on sentiment analysis. In the SemEval ABSA-2016 competition, datasets were published in 8 different languages for HTDA and the teams competed for sentiment analysis. There are different subtasks in the competition, determining sub-categories such as aspect term, category and sentiment class. One of these subtasks is to determine the aspect term. HTDA studies for Turkish language are quite limited. There are studies using different languages and different word representation methods. There is no study examining the effect of word representation methods for the Turkish data set of SemEval Absa 2016 competition. This study was carried out to examine the success of different word representation methods in identifying aspect terms in customer comments. This study was carried out with the aim of examining the success of different word representation methods in identifying target terms in customer comments. Word2Vec, Glove and Fasttext word representation methods were examined within the scope of the analysis and it was seen that the method that could detect the aspect term most successfully was the Fasttext word representation method. The highest classification success for Turkish dataset in the literature with a success rate of 77% in terms of the F-1 score was also achieved in the study.


Language :
Database :
Journal :
Volume: 15, Issue: 4 443-452, Journal of Information Technologies, Bilişim Teknolojileri Dergisi
Accession number :