Back to Search
Start Over
Farklı Sınıflandırma Algoritmaları ve Metin Temsil Yöntemlerinin Duygu Analizinde Performans Karşılaştırılması
- Source :
- Düzce Üniversitesi Bilim ve Teknoloji Dergisi, Vol 9, Iss 6, Pp 406-416 (2021)
- Publication Year :
- 2021
- Publisher :
- Düzce University, 2021.
-
Abstract
- Son yıllarda internete erişim imkanlarının artması ve kullanıcılardaki akıllı telefon kullanımının yaygınlaşması sebebiyle sosyal medya olarak adlandırılan ve insanların çeşitli konulardaki fikirlerini paylaştığı servisler çok yaygın olarak kullanılmaktadır. Sosyal medya verilerinin analiz edilmesiyle insanların farklı konulardaki duygularına dair anlamlı çıkarımlarda bulunulması anlamına gelen ve temelde bir sınıflandırma işlemi olan Duygu Analizi çalışmaları son yıllarda öne çıkan çalışma alanlarından biridir. Bu çalışmada, Python programlama dili içindeki kütüphaneler kullanılarak Naive Bayes (NB), Logistic Regression (LR), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF) ve Artificial Neural Network (ANN) gibi 6 adet sınıflandırma algoritmasının Duygu Analizi kapsamında, performans karşılaştırması yapılmıştır. Veri seti olarak, açık kaynaklı, IMDB sitesinde yer alan etiketli kullanıcı yorumları kullanılmıştır. Doğal Dil İşleme yöntemleri kullanılarak temizlenen veri setinin sayısal olarak temsil edilebilmesi için Bag of Words (BoW), TF-IDF, FastText ve Word2Vec metin temsil yöntemleri kullanılmıştır. Veri setinin eğitimi ve test edilmesi aşamasında k=5 olacak şekilde k-fold cross validation yöntemi kullanılmıştır. 6 farklı sınıflandırma yöntemi için elde edilen sonuçlar accuracy, precision, recall ve f1 score hesaplanarak ayrıntılı bir karşılaştırma yapılmış ve sonuçlar kaydedilmiştir. En yüksek accuracy değerleri olarak LR ve SVM sırasıyla BOW’da %86, TF-IDF’te %87, word2Vec’de %87 ve FastText’te %83 seviyelerinde benzer sonuçlar vermiştir.
- Subjects :
- doğal dil i̇şleme
duygu analizi
makine öğrenmesi
metin temsil
sınıflandırma
veri madenciliği
natural language processing
sentiment analysis
machine learning
text representation
classification
data mining
Technology
Engineering (General). Civil engineering (General)
TA1-2040
Science
Science (General)
Q1-390
Subjects
Details
- Language :
- English, Turkish
- ISSN :
- 21482446
- Volume :
- 9
- Issue :
- 6
- Database :
- Directory of Open Access Journals
- Journal :
- Düzce Üniversitesi Bilim ve Teknoloji Dergisi
- Publication Type :
- Academic Journal
- Accession number :
- edsdoj.07f4a9eddad6480f92cdb61ee3e8b749
- Document Type :
- article
- Full Text :
- https://doi.org/10.29130/dubited.1015320