Back to Search Start Over

Building a Social Media Adapted PoS Tagger Using FlexTag – A Case Study on Italian Tweets

Authors :
Horsmann, Tobias
Zesch, Torsten
Publication Year :
2017
Publisher :
Accademia University Press, 2017.

Abstract

We present a detailed description of our submission to the PoSTWITA shared-task for PoS tagging of Italian social media text. We train a model based on FlexTag using only the provided training data and external resources like word clusters and a PoS dictionary which are build from publicly available Italian corpora. We find that this minimal adaptation strategy, which already worked well for German social media data, is also highly effective for Italian. Vi presentiamo una descrizione dettagliata della nostra partecipazione al task di PoS tagging for Italian Social Media Texts (PoSTWITA). Abbiamo creato un modello basato su FlexTag utilizzando solo i dati forniti e alcune risorse esterne, come cluster di parole e un dizionario di PoS costruito da corpora italiani disponibili pubblicamente. Abbiamo scoperto che questa strategia di adattamento minimo, che ha già dato buoni risultati con i dati di social media in tedesco, è altamente efficace anche per l’Italiano.

Details

Language :
English
Database :
OpenAIRE
Accession number :
edsair.openedition...edf04dd057d1c11a61a90a2652aeb4b4