10 results on '"Öznitelik seçimi"'
Search Results
2. Müşteri Kayıplarının Tahmini Üzerine Bir Veri Madenciliği Uygulaması.
- Author
-
Büyükkeçeci, Mustafa and Okur, Mehmet Cudi
- Abstract
Copyright of Dokuz Eylul University Muhendislik Faculty of Engineering Journal of Science & Engineering / Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi is the property of Dokuz Eylul Universitesi Muhendislik Fakultesi Fen ve Muhendislik Dergisi and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2022
- Full Text
- View/download PDF
3. ANALYSIS OF THE FEATURES FOR AUTOMATIC CLASSIFICATION OF ACADEMIC PERFORMANCE.
- Author
-
EREN, Hakan Alp and GUNAL, Efnan SORA
- Subjects
COLLEGE teachers ,PERFORMANCE contracts in education ,DATA mining ,MACHINE learning ,FEATURE selection - Abstract
Copyright of Journal of Engineering & Architectural Faculty of Eskisehir Osmangazi University / Eskişehir Osmangazi Üniversitesi Mühendislik ve Mimarlık Fakültesi Dergisi is the property of Eskisehir Osmangazi University and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2022
- Full Text
- View/download PDF
4. Data Mining Genome-Based Algorithm for Optimal Gene Selection and Prediction of Colorectal Carcinoma.
- Author
-
BANJOKO, Alabi Waheed
- Subjects
- *
COLON cancer , *DATA mining , *ALGORITHMS , *FORECASTING , *GENE expression profiling - Abstract
Objective: This study presents a method for optimal selection of gene subsets to enhance the non-clinical diagnostic classification and prediction of colorectal cancer using gene expression level of gene expression profiles obtained with an Affymetrix oligonucleotide array. Material and Method: A Hybrid multiobjective Support vector Machine (SVM) feature selection and classification algorithm was employed to determine the Biomarker gene subsets that are highly statistically and clinically relevant to the 62 (tumour or normal) responses of the gene expression levels. The genes selection was done in two stages with the first stage using the Bayesian t-test to prune the non-informative genes and the second stage employed the multi-objective optimization method that allows sequential addition of genes for optimal determination of the pre-selected gene subsets. The SVM with RBF kernel (SVMREF) was fitted sequentially to select the set of near-optimal genes that are correlated with the response class. Results: The optimally selected gene subset yielded an accuracy of 90.1% on the test data that were never used in the building process of the algorithm. Furthermore, the results obtained from the principal component analysis and the complete linkage hierarchical clustering indicated near-perfect discrimination of the two clinical response groups of the colorectal cancer status of the patients. Conclusion: This work has fully demonstrated that non-clinical colon cancer diagnosis and prediction of patients using their gene signatures from the gene microarray expression data is very possible when the appropriate data mining technique tools are used. [ABSTRACT FROM AUTHOR]
- Published
- 2020
- Full Text
- View/download PDF
5. Android Platformunda Kötücül Yazılım Tespiti: Literatür İncelemesi.
- Author
-
PEYNİRCİ, Gökçer and EMİNAĞAOĞLU, Mete
- Abstract
Copyright of International Journal of InformaticsTechnologies is the property of Institute of Informatics, Gazi University and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
- Published
- 2020
- Full Text
- View/download PDF
6. A Data Mining Application in Customer Churn Prediction
- Author
-
BÜYÜKKEÇECİ, Mustafa and OKUR, Mehmet Cudi
- Subjects
Engineering ,Mühendislik ,Knowledge Discovery in Databases (KDD) ,Data Mining ,RFM Segmentation ,Feature Selection ,Dimension Reduction ,Classification ,Veri Tabanlarında Bilgi Keşfi (VTBK) ,Veri Madenciliği ,RFM Bölümlemesi ,Öznitelik Seçimi ,Sınıflandırma - Abstract
Müşteri memnuniyeti ve sadakati uygun fiyat, ürün çeşitliliği, hızlı tedarik ve sevkiyat, ürün kalitesi, satış öncesi ve sonrası hizmetler ve müşteri davranışlarının analiz edilmesi ile sağlanır. Müşteri davranışlarını analiz eden işletmeler hem mevcut müşterilerini koruyabilir hem de yenilerini kazanabilir. Bu çalışmanın amacı işletmeleri terk etme ihtimali olan müşterileri tahmin edebilen gözetimli modeller üretmektir. Bu amaçla toplamda 21 sınıflandırma yöntemi ve telekomünikasyon, bankacılık ve e–ticaret sektörlerine ait veri kümeleri kullanılarak deney çalışmaları gerçekleştirilmiştir. Ayrıca işletmelerin harcama alışkanlıklarına göre müşterileri sıralamak ve sınıflandırmak için kullandıkları basit ama etkili bir pazarlama analiz aracı olan RFM (Recency, Frequency, Monetary Value) bölümlemesi, Ki-Kare Testi ile birlikte boyut indirgeme metodu olarak kullanılmıştır. Böylelikle optimal eleman sayısına sahip öznitelik altkümelerinin elde edilmesi ve öznitelik seçim öncesi ve sonrası model performanslarının kıyaslanması hedeflenmiştir., Customer satisfaction and loyalty can be achieved through reasonable prices, product variety, fast supply and delivery, product quality, pre and post-sales services and analysis of customer behaviors. Businesses that analyze customer behavior can both retain existing customers and gain new ones. This study aims to build supervised models that can predict customers who are likely to leave businesses. To this end, experiments were carried out using a total of 21 classification methods and datasets from the telecommunications, banking, and e-commerce industries. In addition, RFM (Recency, Frequency, Monetary Value) segmentation, a simple but effective marketing analysis tool used by businesses to rank and classify customers according to their spending habits, was used as a dimension reduction method together with the Chi-Square Test. Thus, it is aimed to obtain feature subsets with optimal number of elements and to compare model performances before and after feature selection.
- Published
- 2021
7. Data Mining and Statistics in Data Science
- Author
-
Güner Gözde Kılıç, Münevver Turanli, Ünal Halit Özden, and Bölüm Yok
- Subjects
Computer science ,Data Science ,Statistics ,Veri Önişleme ,Feature selection ,Veri Bilimi ,computer.software_genre ,Veri Madenciliği ,Öznitelik Seçimi ,İstatistik ,Data Preprocessing ,Data Mining ,Data pre-processing ,Data mining ,Feature Selection ,computer - Abstract
In parallel with the developing technology of modern age, there has been a corresponding increase in computer domains that possess data storage function. Therefore, methods which allow storing large data gained an equally grave attention. In this study some of the most popular data analysis methods, namely data mining and statistical methods, have been investigated. The aim of this study is to exhibit the correlation between data mining and statistics. To achieve this aim, firstly data mining process has been explored. Next the need to implement statistical methods during this process has been accentuated. Günümüz teknolojisinin ilerlemesine bağlı olarak, bilgisayarların bilgi saklama kaydı yapılan alanlarında da artışlar meydana gelmektedir. Bu nedenle, büyük verilerin analiz edilmesini sağlayan yöntemler de büyük önem kazanmaktadır. Bu çalışmada, veri analizinde yaygın olarak kullanılan veri madenciliği ve istatistiksel yöntemler incelenmiştir. Bu çalışmanın amacı, veri madenciliği ile istatistik arasındaki ilişkinin ortaya konmasıdır. Bu nedenle, öncelikle veri madenciliği süreci açıklanmış daha sonra bu süreçte istatistiksel yöntemlerin gerekliliği vurgulanmıştır.
- Published
- 2019
- Full Text
- View/download PDF
8. Differentially private attribute selection for classification
- Author
-
Ali Inan, Esra Var, Işık Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Işık University, Faculty of Engineering, Department of Computer Engineering, and Var, Esra
- Subjects
Classification accuracy ,Classification tasks ,0211 other engineering and technologies ,Data preprocessing ,02 engineering and technology ,State of the art ,Differential privacies ,diferansiyel mahremiyet,sınıflandırma,öznitelik seçimi ,Statistical database security ,Architecture ,0202 electrical engineering, electronic engineering, information engineering ,Sınıflandırma ,Data mining ,021101 geological & geomatics engineering ,Diferansiyel mahremiyet ,Classification (of information) ,Learning systems ,Privacy-preserving classification ,General Engineering ,Solution mining ,Classification ,Attribute selection ,Differential privacy ,Öznitelik seçimi ,020201 artificial intelligence & image processing ,Noise ,Data privacy - Abstract
Veri madenciliği ve makine öğrenmesi çözümlerinin en önemli ön aşamalarından biri yapılacak analizde kullanılacak verinin özniteliklerinin uygun bir alt kümesini belirlemektir. Sınıflandırma yöntemleri için bu işlem, bir özniteliğin sınıf niteliği ile ne oranda ilişkili olduğuna bakılarak yapılır. Kişisel gizliliği koruyan pek çok sınıflandırma çözümü bulunmaktadır. Ancak bu yöntemler için öznitelik seçimi yapan çözümler geliştirilmemiştir. Bu çalışmada, istatistiksel veritabanı güvenliğinde bilinen en kapsamlı ve güvenli çözüm olan diferansiyel mahremiyete dayalı özgün öznitelik seçimi yöntemleri sunulmaktadır. Önerilen bu yöntemler, yaygın olarak kullanılan bir veri madenciliği kütüphanesi olan WEKA ile entegre edilmiş ve deney sonuçları ile önerilen çözümlerin sınıflandırma başarımına olumlu etkileri gösterilmiştir. Selecting a relevant subset of attributes is one of the most important data preprocessing steps of data mining and machine learning solutions. For the classification task, selection is based on the correlation between an attribute and the class attribute. There are various studies on privacy preserving classification. However, there is no attribute selection solution for such work in the literature. In this study, novel attribute selection methods based on the state of the art solution in statistical database security, known as differential privacy, are proposed. The proposed solutions are implemented with the popular data mining library WEKA and experimental results confirm the positive effects of the proposed solutions on classification accuracy. Publisher's Version
- Published
- 2018
- Full Text
- View/download PDF
9. Görüntüler üzerinde öznitelik çıkarma ve seçimine odaklı bir örüntü tanıma çerçevesi geliştirilmesi
- Author
-
Taşci, Arif Erdal, Uğur, Aybars, Fen Bilimleri Enstitüsü, and Bilgisayar Mühendisliği Anabilim Dalı
- Subjects
Feature ,Optimization ,Machine learning methods ,Örüntü Tanıma ,Image Processing ,Derin Öğrenme ,Deep learning ,Pattern Recognition ,Computer Engineering and Computer Science and Control ,Feature Extraction ,Veri Madenciliği ,Machine Learning ,Eniyileme ,Deep Learning ,Image processing ,Öznitelik Seçimi ,Pattern recognition ,"null" ,Data Mining ,Öznitelik Çıkarma ,Feature Selection ,Görüntü Işleme ,Makine Öğrenmesi ,Data mining ,Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol - Abstract
Günümüzde dijital görüntülerin sayısı, teknolojik imkânların ve aygıtların kullanılması ile birlikte giderek artış göstermektedir. Görüntü türlerinin bilgisayar destekli sınıflandırılması tıp, güvenlik, otomasyon gibi pek çok uygulama alanında yaygın olarak kullanılmaktadır. Öznitelik çıkarma ve seçimi, örüntü tanıma sürecinin alt aşamaları olarak sınıflandırma başarımını artırmak açısından oldukça önem taşımaktadır. Tez çalışmasında, görüntüler üzerinde öznitelik çıkarma ve seçimi aşamalarının her ikisini de içeren bir örüntü tanıma çerçevesi geliştirilmiştir. Çerçevenin ilk alt modelinde, sadece manuel öznitelik çıkarma yöntemleri kullanılmıştır. Bu modelde, 4 tanesi merkez noktasına göre ikiye ayrılmış görüntülerden türetilen özgün öznitelikler olmak üzere, 194 adet öznitelik çıkarmayı sağlayan geniş bir yöntem kümesi oluşturulması literatüre yapılan katkılardandır. Öznitelik seçimi aşamasında ise genetik algoritmalardan yararlanılmıştır. Literatüre diğer bir katkı olarak geliştirilen ikinci alt modelde ise, derin öğrenme kullanılarak çıkarılan öznitelik kümesi de ilk alt modele eklenerek sistem genişletilmiş ve böylece tanıma performansı artırılmıştır. Tez kapsamında, manuel olarak 194, derin öğrenmeyle 4096 olmak üzere toplamda 4290 öznitelik çıkarmayı sağlayan bir çatı oluşturulmuş, deneysel çalışmalarda Flavia ve Caltech-101 verisetleri kullanılmıştır. Her iki verisetinde en iyi sınıflandırma başarımının ECOC-SVM modeli ile sağlandığı ve literatürdeki en iyi sonuçlara göre karşılaştırılabilir olduğu gösterilmiştir., Nowadays, the number of digital images is increasing gradually with the use of technological possibilities and devices. Computer aided classification of image types is widely applied in many applications such as medicine, security, automation. The feature extraction and selection stages have great importance in terms of increasing the classification performance as the substages of the pattern recognition process. In the thesis, a pattern recognition framework including both of feature extraction and selection stages on images is developed. In the first submodel of the framework, only manual feature extraction methods are used. In this model, making up a large set of methods for extracting 194 features, 4 of which are novel ones derived from images divided into two sections according to the center point, is one of the contributions to the literature. Genetic algorithms are utilized in the feature selection stage. In the second submodel, which is developed as another contribution to the literature, the system is extended by adding the feature set extracted by using deep learning to the first submodel, thus recognition performance is improved. In the scope of the thesis, a framework was created for extracting total of 4290 features (194 handcrafted and 4096 deep learning features), Flavia and Caltech-101 datasets were used in the experimental studies. It is shown that the best classification performance for two datasets is provided with the ECOC-SVM model and it is competetive compared to the existing state-of-the-art results in the literature.
- Published
- 2018
10. Prediction Of Borsa Istanbul (bist) 100 Index Direction Using Financial News Articles
- Author
-
Gündüz, Hakan, Çataltepe, Zehra, Bilgisayar Mühendisliği, and Computer Engineering
- Subjects
Bilgi erişim ,Örüntü tanıma ,Borsa yön tahmini ,Natural language processing ,Text retrieval ,Veri madenciliği ,Doğal dil işleme ,Performans değerlendirme ,Pattern recognition ,Stock market direction prediction ,Feature selection ,Performance evaluation ,Metinden öğrenme ,Öznitelik seçimi ,Information retrieval ,Text learning ,Text categorization ,Metin erişim ,Data mining ,Metin sınıflandırma - Abstract
Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2013, Thesis (M.Sc.) -- İstanbul Technical University, Institute of Science and Technology, 2013, Yapılan tez çalışmasında internet sitelerinde yayınlanan ekonomi haberleri kullanılarak Borsa İstanbul (BIST) 100 endeksi günlük açılış fiyatının yönü tahmin edilmiştir. Çalışmada kullanılan haber metinleri Borsa İstanbul?daki şirketlerin resmi bildirimlerinin yayınladığı Kamu Aydınlatma Platformu (KAP) internet sitesinden ve iki finansal internet sitesinden elde edilmiştir. Haber metinlerine metin madenciliği teknikleri uygulanarak, her işlem gününe ait öznitelik vektörleri oluşturulmuştur. BIST 100 endeksine ait günlük açılış fiyatlarındaki anlamlı değişiklikler sınanarak değişim yönünü gösteren sınıf etiketleri oluşturulmuş ve bu etiketler öznitelik vektörlerine atanmıştır. Öznitelik vektörlerinin boyutunun yüksek olması ve örnek sayısının az olması nedeniyle, haber metinlerinde bulunan kelimeler üzerinde öznitelik seçimi gerçekleştirilmiştir. Öznitelik seçiminde veri kümesindeki sınıf dengesizliği ile başa çıkabilmek için, karşılıklı bilgi öznitelik seçme yöntemi ile birlikte yeniden örneklemeyi temel alan yeni bir öznitelik seçme yöntemi ortaya konmuştur. Dengeli dağılımlı karşılıklı bilgi yöntemi olarak isimlendirilen bu yöntem kullanılarak BIST 100 endeksinin anlamlı yön değişimleri %74 doğruluk ve %68,4 Makro-ortalama F-Ölçütü oranlarıyla tahmin edilmiştir. Kullanılan bu yöntem, karşılıklı bilgi, bilgi kazanımı ve Ki-kare istatistiği öznitelik seçme yöntemleri ile karşılaştırılmış ve dengesiz dağılımlı bilgi kazanımının daha az sayıda öznitelik kullanarak daha başarılı sınıflandırma sonuçları elde ettiği görülmüştür. Ayrıca kullanılan haber metinlerinin alındığı kaynaklar ve BIST 100 endeksinin günlük geçmiş açılış, kapanış ve hacim fiyatları da göz önünde bulundurularak tahmin gerçekleştirilmiştir., In this thesis, we predicted the direction of Borsa Istanbul (BIST) 100 Index (XU 100) open price using the news articles released the day before. News articles were provided by Public Disclosure Platform of BIST and two financial websites. Text mining techniques were applied on the news articles to form feature vectors for each trading day. The significant changes of BIST 100 index open price were examined to create the class labels and these labels were assigned to input vectors available for each day. Due to the high dimensionality of inputs and small number of instances for training, feature selection on the words of the news articles was needed. In order to deal with the data imbalance problem, a mutual information and resampling based feature selection method was devised. The method considered the fact that classes were imbalanced for the stock market data and computed the MI after balancing the data, therefore we called this method of relevance computation Balanced Mutual Information (BMI). Experimental results showed that, with BMI, the significant changes in the BIST 100 Index could be predicted, with an accuracy of 74% and a Macro Averaged F-Measure of 68,4%. This balanced feature selection method were compared with three other methods, a basic Mutual Information based, Information Gain and Chi-Square feature selection and it was found out that balanced feature selection results in higher performance using a smaller number of features. Also, the effects of the news sources and the previous days price information on prediction were examined., Yüksek Lisans, M.Sc.
- Published
- 2013
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.