1. Automatisation d’un processus de contrôle qualité de données au format tableur issues de Prodinra
- Author
-
CARIOU, Sylvain, Coppolino, Alexandra, Frappier, Lise, Structures et Marché Agricoles, Ressources et Territoires (SMART-LERECO), Institut National de la Recherche Agronomique (INRA)-AGROCAMPUS OUEST, Centre d'Economie de l'Environnement - Montpellier - FRE2010 (CEE-M), Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro)-Institut National de la Recherche Agronomique (INRA)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM), Structures et Marché Agricoles, Ressources et Territoires (SMART), AGROCAMPUS OUEST-Institut National de la Recherche Agronomique (INRA), Institut National de la Recherche Agronomique (INRA)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro), Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro), and Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut National de la Recherche Agronomique (INRA)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)
- Subjects
informatique documentaire ,tableur ,département scientifique ,département ,information scientifique et technique ,[SHS.INFO]Humanities and Social Sciences/Library and information sciences ,computerized processing ,technical and scientific information ,department ,contrôle de la qualité ,valorisation ,data quality ,scientific publication ,automation ,bibliométrie ,codage informatique ,prodinra ,sciences humaines et sociales ,publication scientifique ,documentation data processing ,spreadsheet ,Library and information sciences ,Sciences de l'information et de la communication ,reuse ,qualité des données ,bibliometrical indicators ,traitement informatique ,automatisation - Abstract
Les professionnels de l’Information Scientifique et Technique (IST), de l’Inra veillent à ce que les données disponibles dans l’archive ouverte ProdInra soient de qualité. Ce travail est indispensable pour l’obtention de listes de publications et d’indicateurs les plus fiables possible. Dans ce cadre, nous avons travaillé en collaboration avec un informaticien sur une automatisation d’un processus de contrôle qualité de données extraites au format tableur pour gagner en efficacité. Cet article décrit notre démarche. Il vous propose de faire de même pour votre corpus bibliographique issu de ProdInra. Vous trouverez également des conseils sur les précautions à prendre pour utiliser les fichiers de sortie. Enfin, nous proposons des évolutions en prévision du passage de ProdInra à HaL., The INRA professionals of Technical and Scientific Information (IST) look after the quality of data available in the open repository ProdInra. This work allows obtaining some lists and indicators the most reliable possible about the publications. In this scope, we work together with a computer expert on the automatization to set up an automatized quality control process based on a extracted excel file, which would be more efficient. This paper describes the process in detail, so this process could be reused for anyone who works with a corpus of publications in ProdInra. You will find as well some precautionary advices and cares about the files that are used in the process. We propose then possible evolutions for the future ProdInra when migrated in the HAL infrastructure.
- Published
- 2019