Back to Search
Start Over
Tavsiye sistemlerinde veri bütünleştirme
- Publication Year :
- 2012
- Publisher :
- Fen Bilimleri Enstitüsü, 2012.
-
Abstract
- Tavsiye sistemlerinde temel amaç, insanların beğenisini tahmin edip onlara bu beğenileri doğrultusunda tavsiyelerde bulunmaktır. Bu alanda en yaygın olarak kullanılan yöntemler;?İçerik Tabanlı Filtreleme?İşbirlikçi Filtreleme Yöntemi (İF)?Melez Filtreleme Sistemleri?Demografik Yöntemler?Bilgi Bazlı Yöntemlerİçerik bazlı filtreleme yöntemleri, üzerinde çalışılan ürünle (şarkı, film, kitap vs.) ilgili bilgiler kullanılarak benzer ürünlerin önerilmesi esasına dayanır. İF yönteminin çalışma prensibi ise diğer kullanıcı ve/veya kullanıcı gruplarının öneri ve öngörülerine dayanır. Bir kullanıcıya tavsiyede bulunabilmek için diğer kullanıcıların benzer içeriklere verdiği değerler kullanılır. Kullanıcılar arasındaki benzerliklere göre diğer kullanıcıya benzer tavsiyelerde bulunulur. Melez sistemler ise iki yöntemin birlikte kullanılmasına dayanır.Veri bütünleştirme işlemi; İF yönteminde kullanılan, kullanıcı ve bu kullanıcıların öğeler üzerinde yaptığı değerlendirmeler ile oluşturulmuş veri setlerinin iki yönlü olarak birleştirilmesidir. Bu işlemin amacı, dikey oluşturulmuş vektörlerin yatay vektörlerinin sonuna eklenmesi ile daha çok sayıda öz niteliğe sahip yeni vektörler oluşturmaktır.Bu çalışmada yeni bir melez yöntem önerilmiş ve meta veriler kullanılarak elde edilen içerik bazlı tahminler üzerinde, ?bir kullanıcının ürünlere verdiği değerler? bilgisi ile ?bir içeriğe verilen bütün kullanıcı değerleri? bilgilerini birleştirererek kullanan bir çift yönlü sınıflandırma yaklaşımı denenmiştir. Oluşturulan yeni gösterim üzerinde güncel iki sınıflandırma algoritması olan ?Destek Vektör Makinesi? ve ?K-En Yakın Komşu? yöntemleri denenmiş, birbirleriyle ve daha önceki çalışmalarla sonuçları karşılaştırmıştır. Bu çalışmada, veri bütünleştirme yönteminin kullanımı ile tavsiye sistemlerinin daha iyi sonuçlar vermesi amaçlanmıştır.Bu alanda yöntemlerin performanslarını değerlendirirken en çok kullanılan F-ölçütüne göre daha önceki yöntemlerin üstünde bir sınıflandırma yeterliliği elde edilmiştir. Kaynak kullanım performansları açısından değerlendirildiğinde ise ?Destek Vektör Makinesi? (DVM), ?K-En Yakın Komşu? (KNN) algoritmasına göre daha çok bellek tüketmektedir. Süre olarak da daha uzun sürede sonuç vermektedir. KNN ise CPU kullanımında çok yüksek bir kullanım sergilemektedir. The main goal of recommendation systems is to predict the user pleasure and to recommend something in the boundry of its pleasure. In recommendation systems, the most effective techniques are ;?Content - Based Filtering?Collaborative Filtering?Hybrid Filtering Systems?Demographic Filtering?Knowledge - Based FilteringContent - Based Filtering is mainly interested about the similarities of content between the current item (music, movie, book, etc.) and the others. In opposition of Content - Based, in Collaborative Filtering system is interested in interaction of users. The choice of the current user depends on the choices and prevision of the other users or user groups. According to prevision of users, the system recommends similar item to the current user.Data Integration is a method that uses users evaluation vectors on items. The aim of this operation to get more complex vectors which have more features by joining the horizontal and vertical vectors of datasets.In this thesis, a new hybrid system is proposed. On the prediction values which are produced by content based filtering using by metadata of items; `Rating of one user on all items` information and `Ratings of all users on one item` information is integrated. After this integration; `Support Vector Machine` and `K - Nearest Neighbor?, the most popular classification algorithms, are executed on these new datasets. The main goal of this thesis is to increase the forecast perfomance of recommendation systems by data integration.Finally in the comparison of this technique and other techniques shows us that the data integration technique gives better results according to F- measure. On the other hand, there is also a comparison according to resource usage. `Support Vector Machine` (SVM) uses more memory and takes more time to solve the problem. However `K - Nearest Neighbor? (KNN) uses much more CPU. 81
Details
- Language :
- Turkish
- Database :
- OpenAIRE
- Accession number :
- edsair.od.....10208..f3fb68b22ff3b891520a7ddb6e695824