Back to Search Start Over

第二言語コーパスの自然言語形態素解析に対する評価

Authors :
Hagerman, Craig
関根, 秀和
Source :
大阪女学院大学紀要. 8:29-42
Publication Year :
2012
Publisher :
大阪女学院大学, 2012.

Abstract

自由論文<br />Automated Part-of-Speech (POS) tagging is commonly on corpora in order to allow for the systematic study. POS tagging is also a fundamental stage in most natural language processing (NLP) tasks. Although there is a long history of research into automated POS tagging in the field of NLP, the vast majority of the research has been on first language texts. Increasingly second language learner corpora are being compiled. As well, increasing use of English as a second language makes the processing of non-native English texts increasingly likely for NLP applications. However, there is very little research into how second language texts affect the performance of automated POS taggers. This paper describes a study which (1) compares the performance of three taggers on native and second language texts and (2) identifies which POS tagger has the highest level of accuracy when faced with second language writing.<br />コンピューターによる自動形態素解析は自然言語処理研究において非常に基本的なステージであり、コーパスを使い研究を進める上で必要な要素である。 自動形態素解析の研究は 自然言語処理の分野で長い歴史があるにもかかわらず、そのほとんどは第一言語を基本としたテキストでなされている。英語を第二言語として使われることが多くなっている現在ではコーパスでも英語を母国語としない人々が書いた文面が多く見られる。しかしながら第二言語で書かれた文面が自動形態素解析にどのような影響を与えるかという研究はあまりなされていない。 この論文は3 つの形態素解析を使用し第一言語と第二言語のテキストを比べ、どの形態素解析が一番高いレベルで 第二言語のテキストを正確に解析できるかを述べたものである。

Details

Language :
English
ISSN :
18800084
Volume :
8
Database :
OpenAIRE
Journal :
大阪女学院大学紀要
Accession number :
edsair.jairo.........ddf1ea589c33609204b5ede46b0df691