1. Les technologies du Web pour la valorisation d’un patrimoine industriel textile en mouvement dans les Hauts-de-France
- Author
-
Kergosien, Eric, Wybo, Mathilde, Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication - ULR 4073 (GERIICO ), Université de Lille, Institut de Recherches Historiques du Septentrion (IRHiS) - UMR 8529 (IRHiS), Centre National de la Recherche Scientifique (CNRS)-Université de Lille, Ministère de la culture, Université Lille, MESHS, and Université de Lille-Centre National de la Recherche Scientifique (CNRS)
- Subjects
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing ,patrimoine industriel textile ,recherche collaborative ,Mémoire orale ,base de connaissances ,histoire ,[SHS.INFO]Humanities and Social Sciences/Library and information sciences ,[INFO.INFO-WB]Computer Science [cs]/Web ,données ouvertes ,ComputingMilieux_MISCELLANEOUS ,cartographie des acteurs - Abstract
National audience; Une question sociale importante dans le domaine du patrimoine culturel est liée à la collecte, l'analyse, la publication et la mise en valeur de la mémoire des acteurs du domaine, soit parlée ou écrite. La formalisation de l'information sur le patrimoine culturel constitue un véritable défi. Le volume et la diversité des ressources posent de nombreux problèmes tels que l’indexation des données, leur structuration et leur valorisation au sein d'une même base de connaissances. La plupart des tentatives de résolution des problèmes d'interopérabilité sémantique se concentrent sur la standardisation et le développement de structures communes telles que FRBR, FRBRoo, CIDOC CRM, etc. Parmi ces modèles, le CIDOC estune référence conceptuelle, modèle spécialement conçu pour la modélisation du patrimoine culturel. Ce modèle offre en effet un schéma commun de métadonnées rendant les concepts compréhensibles et interopérables.Afin d'aider les experts du domaine à produire et fournir des contenus numériques, nous adoptons une méthodologie en trois étapes qui permet de construire semi-automatiquement une représentation sémantique d'un domaine étudié à partir de documents hétérogènes. Tout d'abord, nous recueillons et formalisons l'historique par le biais d'entretiens avec les acteurs du domaine. Deuxièmement, notre système opère l'identification et l'extraction d'informations relatives au patrimoine culturel industriel à partir de milliers de documents textuels hétérogènes collectés auprès de ces acteurs (interviews, articles de journaux, etc.). L'approche proposée combine la projection lexicale avec des méthodes de fouille de textes pour améliorer l'identification de l'information pertinente. Enfin, nous présentons une première version de l'ontologie construite automatiquement au format OWL en utilisant le modèle CIDOC CRM comme base conceptuelle, pour fusionner toutes les informations extraites. Les expériences sont menées sur un corpus relatif au patrimoine industriel textile collecté grâce au projet DENIM.
- Published
- 2021