Back to Search Start Over

Les technologies du Web pour la valorisation d’un patrimoine industriel textile en mouvement dans les Hauts-de-France

Authors :
Kergosien, Eric
Wybo, Mathilde
Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication - ULR 4073 (GERIICO )
Université de Lille
Institut de Recherches Historiques du Septentrion (IRHiS) - UMR 8529 (IRHiS)
Centre National de la Recherche Scientifique (CNRS)-Université de Lille
Ministère de la culture, Université Lille, MESHS
Université de Lille-Centre National de la Recherche Scientifique (CNRS)
Source :
La fabrique numérique des corpus en sciences humaines et sociales, La fabrique numérique des corpus en sciences humaines et sociales, A paraître, Colloque « Corpus et archives numériques »-DHNord2019, Colloque « Corpus et archives numériques »-DHNord2019, Oct 2019, Lille, France
Publication Year :
2021
Publisher :
HAL CCSD, 2021.

Abstract

National audience; Une question sociale importante dans le domaine du patrimoine culturel est liée à la collecte, l'analyse, la publication et la mise en valeur de la mémoire des acteurs du domaine, soit parlée ou écrite. La formalisation de l'information sur le patrimoine culturel constitue un véritable défi. Le volume et la diversité des ressources posent de nombreux problèmes tels que l’indexation des données, leur structuration et leur valorisation au sein d'une même base de connaissances. La plupart des tentatives de résolution des problèmes d'interopérabilité sémantique se concentrent sur la standardisation et le développement de structures communes telles que FRBR, FRBRoo, CIDOC CRM, etc. Parmi ces modèles, le CIDOC estune référence conceptuelle, modèle spécialement conçu pour la modélisation du patrimoine culturel. Ce modèle offre en effet un schéma commun de métadonnées rendant les concepts compréhensibles et interopérables.Afin d'aider les experts du domaine à produire et fournir des contenus numériques, nous adoptons une méthodologie en trois étapes qui permet de construire semi-automatiquement une représentation sémantique d'un domaine étudié à partir de documents hétérogènes. Tout d'abord, nous recueillons et formalisons l'historique par le biais d'entretiens avec les acteurs du domaine. Deuxièmement, notre système opère l'identification et l'extraction d'informations relatives au patrimoine culturel industriel à partir de milliers de documents textuels hétérogènes collectés auprès de ces acteurs (interviews, articles de journaux, etc.). L'approche proposée combine la projection lexicale avec des méthodes de fouille de textes pour améliorer l'identification de l'information pertinente. Enfin, nous présentons une première version de l'ontologie construite automatiquement au format OWL en utilisant le modèle CIDOC CRM comme base conceptuelle, pour fusionner toutes les informations extraites. Les expériences sont menées sur un corpus relatif au patrimoine industriel textile collecté grâce au projet DENIM.

Details

Language :
French
Database :
OpenAIRE
Journal :
La fabrique numérique des corpus en sciences humaines et sociales, La fabrique numérique des corpus en sciences humaines et sociales, A paraître, Colloque « Corpus et archives numériques »-DHNord2019, Colloque « Corpus et archives numériques »-DHNord2019, Oct 2019, Lille, France
Accession number :
edsair.dedup.wf.001..d0782a2d8833cc5c523ea99da47927bf