6 results on '"Eryiğit, Gülşen"'
Search Results
2. Veri Artırımı için Yarı-Denetimli Bağlamsal Anlam Belirsizliği Giderme
- Author
-
TORUNOGLU SELAMET, Dilara and CEBİROĞLU ERYİĞİT, Gülşen
- Subjects
Engineering ,veri artırımı,anlam belirsizliği giderme,derin öğrenme,bağlam vektörü ,Mühendislik ,data augmentation,word sense disambiguation,deep learning,contextual embeddings - Abstract
Recently, neural architectures play a significant role in the task of Word Sense Disambiguation (WSD). Supervised methods seem to be ahead of its rivals and their performance mostly depends on the size of training data. A numerous number of human-annotated data available for WSD task have been constructed for English. However, low-resource languages (LRLs) still face difficulty in finding suitable data resources. Gathering and annotating a sufficient amount of training data is a time consuming and labor-expensive work. To address and overcome this problem, in this paper we investigate the possibility of using a semi-supervised context based WSD approach for data augmentation (in order to be later used for supervised learning). Since, it is even difficult to find WSD evaluation datasets for LRLs, in this study, we use English datasets to build a proof-of concept and to evaluate their applicability onto LRLs. Our semi-supervised approach uses a seed set and context embeddings. We test with 9 different context based language models (including ELMo, BERT, RoBERTa etc.) and investigate their impacts on WSD. We increased our baseline results up to 28 percentage point improvements (baseline with ELMo 50.39% and ELMo Sense Seed Based Average Similarity Model 78.06%) in terms of accuracy. Our initial findings reveal that the proposed approach is very promising for the augmentation of WSD datasets of LRLs. This study is an extention version of the work from [18]., Yapay zekâ alanında son dönemlerde öne çıkan derin öğrenme mimarilerinin, doğal dil işleme konusunun önemli problemlerinden biri olan Anlam Belirsizliği Giderme (ABG) çalışmalarında kayda değer gelişmelere yol açtığı gözlemlenmektedir. Denetimli yöntemler rakiplerine göre daha yüksek performans sergilemektedirler. Bunun en büyük nedeni kullanılan eğitim verilerinin büyüklükleridir. ABG problemi için İngilizce dili üzerinde elle-etiketlenmiş çok miktarda veri çevrim içi olarak erişilebilir durumdadır. Ancak düşük-kaynaklı diller (DKD’ler) probleme uygun veri eksikliği yaşamaktadırlar. Yeterli derecede probleme uygun veri toplamak ve etiketlemek vakit alıcı ve yüksek maliyet gerektiren bir iştir. Bu probleme değinmek ve aşmak üzere, bu çalışmada yarı-denetimli bağlamsal anlam belirsizliği giderme yaklaşımının veri artırımı için (daha sonra denetimli öğrenmede eğitim verisi olarak kullanılmak üzere) kullanılabileceğinin gösterilmesi amaçlanmıştır. Bu bağlamda özellikle DKD’lerde ABG problemi için test verisi bulmanın zor olması nedeniyle yaklaşımın doğruluğunu ve ilerleyen dönemlerde DKD’lerde kullanılabilirliğini ispatlamak amacıyla çevrimiçi bulunan elle-etiketlenmiş İngilizce ABG verisi kullanılmıştır. Oluşturulan yarı-denetimli yöntemde öbek kümesi (seed set) ve bağlam vektörleri (context embeddings) kullanılmaktadır. Yapılan çalışma 9 farklı bağlamsal dil modelinde (ELMo, BERT, RoBERTa vb.) test edilmiş ve her bir dil modelinin ABG problemi üzerindeki etkileri raporlanmıştır. İlk temel yaklaşıma göre sonuçlar üzerinde %28 doğruluk oranında performans artışı sağlanmıştır. (ELMo ile ilk temel yaklaşım ile %50,39 ve ELMo Anlam Öbek Esaslı Ortalama Benzerlik Modeli ile %78,06). Alınan ilk sonuçlara neticesinde, önerilen yaklaşımın özellikle DKD’ler yönelik ABG veri kümesi oluşturmak için gelecek vaat eden ettiği gösterilmiştir. Bu makale [18]’deki çalışmamızın genişletilmiş bir versiyonudur.
- Published
- 2020
3. ITU Validation Set for Metu-Sabancı Turkish Treebank
- Author
-
ERYİĞİT, Gülşen and PAMAY, Tuğba
- Abstract
This paper presents the ITU Turkish Dependency Validation Set firstly introduced in 2007 [36] in order to serve as the test set of the CoNLL-XI shared task (shared task of the Conference on Computational Natural Language Learning 2007 [28] ). The dataset is available from http://web.itu.edu.tr/gulsenc/treebanks.html and is used by several academic studies so far.
- Published
- 2016
4. Biçimbilimsel Çözümleme
- Author
-
Eryiğit, Gülşen
- Subjects
Morphological Analysis,Morphology ,Biçimbilimsel Çözümleme,Morfoloji - Abstract
In natural language processing, the spoken language is first of all transferred into a well-writen text from the media in which it is stored. In this stage, different procedures may be applied dependending on the different medias( i.e. speech records, social media, publications). Some of these are speech-to-text systems, tokenization and text normalization. After transferring the natural language into a well-written text, the principal stage of processing is the analysis of the words, which we call Morphological Analysis. In this survey, we make a detailed investigation of the following issues: Morphological Analysis, its use cases, the approach of human brain into this problem, variant studies focused on morphological analysis of world languages and Turkish in particular., Doğal Dil İşleme’de, konuşulan dil öncelikle kayıtlı olduğu ortamdan düzgün yazılı bir metin haline dönüştürülür. Bu aşamada, dilin kayıtlı olduğu ortama göre (ses kaydı, sosyal medya, basılı yayınlar vb...) farklı işlemler kullanılması gerekebilir. Bunlardan başlıcaları sesden-metine çeviri, bölütleme ve metin normalizasyonu gibi işlemlerdir. Doğal dili düzgün bir yazılı metin haline çevirdikten sonra yapılacak en temel işlem aşaması sözcüklerin analizinin yapıldığı Biçimbilimsel Çözümlemedir. Bu yazıda, Biçimbilimsel Çözümleme’nin ne olduğu, kullanım alanları, insan beyninin bu konudaki yaklaşımı, bu konuda dünya dilleri ve Türkçe üzerine yapılan çeşitli çalışmaların ayrıntılı incelemesi yapılmıştır.
- Published
- 2016
5. The Impact of NLP on Turkish Sentiment Analysis
- Author
-
Yıldırım, Ezgi, Çetin, Fatih Samet, Eryiğit, Gülşen, and Temel, Tanel
- Abstract
Sentiment analysis on English texts is a highly popular and well-studied topic. On the other hand, the research in this field for morphologically rich languages is still in its infancy. Turkish is an agglutinative language with a very rich morphological structure. For the first time in the literature, this paper investigates and reports the impact of the natural language preprocessing layers on the sentiment analysis of Turkish social media texts. The experiments show that the sentiment analysis performance may be improved by nearly 5 percentage points yielding a success ratio of 78.83% on the used data set.
- Published
- 2016
6. A Mobile Assistant for Turkish
- Author
-
Çelikkaya, Gökhan and Eryiğit, Gülşen
- Abstract
In this paper we present a design and animplementation of a mobile assistant applicationthat understands and meets users' requests inTurkish language. The application is able tounderstand requests for a set of phone operationssuch as calling a contact or sending an email andrequests for a set of information services such asmap, weather, and traffic. The understanding ofuser queries relies on existing research onnatural language processing for Turkish and ahybrid approach of rule-based and statisticalclassification methods. Our performance testsrevealed high accuracy results for the operationsthat our application supports.
- Published
- 2016
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.