1. İç mekan tanıma için en yakın komşuya dayalı metrik fonksiyonlar
- Author
-
Çakır, Fatih, Ulusoy, Özgür, Güdükbay, Uğur, and Diğer
- Subjects
Signal processing--Digital techniques ,Image classification ,ComputingMethodologies_IMAGEPROCESSINGANDCOMPUTERVISION ,TA1634 .C35 2011 ,Image recognition ,image auto-annotation ,Object recognition ,Computer vision ,Computer Engineering and Computer Science and Control ,Image processing--Digital techniques ,scene classi cation ,indoor scene recognition ,Labelling ,bag-of-visual words ,nearest neighbor classi- er ,Pattern recognition systems ,Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol - Abstract
İç mekan tanıma, insan yapımı yapıların yüksek sınıf içi varyasyonlar ve sınıfarası benzerlikler göstermesi sebebiyle klasik mekan tanıma alanının zorlu birproblemidir. Resmin bütüncül temsillerini çıkarmak gibi en ileri mekan tanımateknikleri iç mekanlarda düşük performans göstermektedirler. Nesnelerin belirlenmesive ardından onların mekanlarla ilişkilendirilmesi gibi ara kademeler kullanandiğer yöntemlerin de oldukça karmaşık bir ortamda nesnelerin başarıyla lokalizeedilmesi ve tanınması handikapları vardır.Kodkitabı olarak da bilinen görsel kelimeler kümesi tekniğinden faydalanaraken yakın komşu yöntemine dayalı bir metrik fonksiyonu ile bu zorluklarınüstesinden gelebilen bir sınıflandırma yöntemi öneriyoruz. Kodkitabı oluşumuöznitelik uzayının mozaikleştirilmesi olarak ele alınırsa, verilen bir resim için,öznitelik vektörlerinin Voronoi hücrelerinin ortalarına olan öğrenilmiş ağırlıklıuzaklıklarının resmin kategorisi için güçlü bir gösterge olduğunu gözlemledik.Yöntemimiz tek bir tanımlayıcı ile bir iç mekan testinde en gelişmiş yaklaşımlarıgeçmekte ve genel bir mekan veri kümesinde rekabetçi sonuçlar üretmektedir.Bu çalışmada her ne kadar temel sorunumuz iç mekan kategorizasyonu olsa da,önerilen metrik fonksiyonunu otomatik etiketleme problemine de bir temel uygulamaoluşturmak için kullanıyoruz. Gittikçe artan sayısal medya ile, otomatik olarak resimlereanlamsal etiketler çıkarma problemine son on yılda araştırmacılar büyük ilgigöstermişlerdir. Bu tarz içerikleri manüel olarak etiketlemek gibi geleneksel yaklaşımlarçok bıktırıcı ve zaman harcayıcı olarak değerlendirilmektedir. Bu neden resimlerianlamsal olarak başarıyla açıklayan anahtar kelimelerle otomatik olarak etiketleme,çözülmeyi bekleyen önemli bir sorundur. Indoor scene recognition is a challenging problem in the classical scene recognitiondomain due to the severe intra-class variations and inter-class similarities ofman-made indoor structures. State-of-the-art scene recognition techniques suchas capturing holistic representations of an image demonstrate low performance onindoor scenes. Other methods that introduce intermediate steps such as identifyingobjects and associating them with scenes have the handicap of successfullylocalizing and recognizing the objects in a highly cluttered and sophisticatedenvironment.We propose a classication method that can handle such diculties of theproblem domain by employing a metric function based on the nearest-neighborclassication procedure using the bag-of-visual words scheme, the so-called codebooks.Considering the codebook construction as a Voronoi tessellation of thefeature space, we have observed that, given an image, a learned weighted distanceof the extracted feature vectors to the center of the Voronoi cells gives a strongindication of the image's category. Our method outperforms state-of-the-art approacheson an indoor scene recognition benchmark and achieves competitiveresults on a general scene dataset, using a single type of descriptor.In this study although our primary focus is indoor scene categorization, we alsoemploy the proposed metric function to create a baseline implementation for theauto-annotation problem. With the growing amount of digital media, the problemof auto-annotating images with semantic labels has received signicant interestfrom researches in the last decade. Traditional approaches where such content ismanually tagged has been found to be too tedious and a time-consuming process.Hence, succesfully labeling images with keywords describing the semantics is acrucial task yet to be accomplished. 57
- Published
- 2011