1. Technical documents classification
- Author
-
Sylvie Calabretto, Catherine Roussey, Cyril Dumoulin, Samaneh Chagheri, Distribution, Recherche d'Information et Mobilité (DRIM), Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS), Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA), Technologies et systèmes d'information pour les agrosystèmes (UR TSCF), Institut national de recherche en sciences et technologies pour l'environnement et l'agriculture (IRSTEA), Aucun, Continew, Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École Centrale de Lyon (ECL), Université de Lyon-Université Lumière - Lyon 2 (UL2)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Université Lumière - Lyon 2 (UL2), and Centre national du machinisme agricole, du génie rural, des eaux et forêts (CEMAGREF)
- Subjects
Document Structure Description ,Computer science ,Context (language use) ,02 engineering and technology ,DOCUMENT TECHNIQUE ,STRUCTURAL DOCUMENT ,computer.software_genre ,CLASSIFICATION ,Common Source Data Base ,Documentation ,020204 information systems ,DOCUMENT STRUCTURE ,0202 electrical engineering, electronic engineering, information engineering ,MACHINE A VECTEURS DE SUPPORT ,Product design specification ,Information retrieval ,Document classification ,DOCUMENT CLASSIFICATION ,DOCUMENTATION ,Technical documentation ,SUPPORT VECTOR MACHINE ,Technical communication ,[SDE]Environmental Sciences ,Vector space model ,ComputingMethodologies_DOCUMENTANDTEXTPROCESSING ,020201 artificial intelligence & image processing ,VECTOR SPACE MODEL ,computer - Abstract
International audience; This research takes place in an industrial context: the CONTINEW Company. This company ensures the storage and security of critical data and technical documentation. The term technical documentation refers to different documents with product-related data and information that are used and stored for different purposes, such as user manuals and product specifications. They are strongly structured, but different authors have used different styles and models for document construction. The management of this increasing volume of documents requires document classification in order to retrieve information quickly and to construct a standard model for each category of documents.
- Published
- 2011