Back to Search Start Over

TreeLex: A Subcategorisation Lexicon for French Verbs

Authors :
Kupść, Anna
Abeillé, Anne
Kupsc, Anna
Instytut Podstaw Informatyki (IPI PAN)
Polska Akademia Nauk (PAN)
Equipe de Recherche en Syntaxe et Sémantique (ERSS)
Université Bordeaux Montaigne-Université Toulouse - Jean Jaurès (UT2J)-Centre National de la Recherche Scientifique (CNRS)
Linguistic signs, grammar and meaning: computational logic for natural language (SIGNES)
Université Sciences et Technologies - Bordeaux 1-Inria Bordeaux - Sud-Ouest
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)
Université Paris 8 Vincennes-Saint-Denis - UFR Sciences du langage (UP8 UFR SdL)
Université Paris 8 Vincennes-Saint-Denis (UP8)
Laboratoire de Linguistique Formelle (LLF UMR7110)
Centre National de la Recherche Scientifique (CNRS)-Université Paris Diderot - Paris 7 (UPD7)
Polska Akademia Nauk = Polish Academy of Sciences (PAN)
Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Inria Bordeaux - Sud-Ouest
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université Sciences et Technologies - Bordeaux 1
Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS)
Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université de Toulouse (UT)-Université Bordeaux Montaigne (UBM)-Centre National de la Recherche Scientifique (CNRS)
Université Sciences et Technologies - Bordeaux 1 (UB)-Inria Bordeaux - Sud-Ouest
Source :
First International Conference on Global Interoperability for Language Resources, First International Conference on Global Interoperability for Language Resources, Jan 2008, Hong Kong, Hong Kong SAR China
Publication Year :
2008
Publisher :
HAL CCSD, 2008.

Abstract

International audience; TreeLex is a subcategorization lexicon of French verbs, automatically extracted from a syntactically annotated corpus. The lexicon comprises 1362 verbs (12353 occurrences). We present not only a list of verbs with their subcategorization frames but we also estimate the number of different verb frames available in French in general. Additionally, we estimate the average number of frames per verb. After applying various factorization techniques, we obtain 58 frames for a function-based representation (on average, 1.72 frames per verb), and 160 frames for a richer representation based on function-category information (on average, 1.91 frames per verb).

Details

Language :
English
Database :
OpenAIRE
Journal :
First International Conference on Global Interoperability for Language Resources, First International Conference on Global Interoperability for Language Resources, Jan 2008, Hong Kong, Hong Kong SAR China
Accession number :
edsair.dedup.wf.001..c9fbe8c60484039957c2c77f46355ebb