Back to Search
Start Over
Les technologies du Web pour la valorisation d’un patrimoine industriel textile en mouvement dans les Hauts-de-France
- Source :
- La fabrique numérique des corpus en sciences humaines et sociales, La fabrique numérique des corpus en sciences humaines et sociales, A paraître, Colloque « Corpus et archives numériques »-DHNord2019, Colloque « Corpus et archives numériques »-DHNord2019, Oct 2019, Lille, France
- Publication Year :
- 2021
- Publisher :
- HAL CCSD, 2021.
-
Abstract
- National audience; Une question sociale importante dans le domaine du patrimoine culturel est liée à la collecte, l'analyse, la publication et la mise en valeur de la mémoire des acteurs du domaine, soit parlée ou écrite. La formalisation de l'information sur le patrimoine culturel constitue un véritable défi. Le volume et la diversité des ressources posent de nombreux problèmes tels que l’indexation des données, leur structuration et leur valorisation au sein d'une même base de connaissances. La plupart des tentatives de résolution des problèmes d'interopérabilité sémantique se concentrent sur la standardisation et le développement de structures communes telles que FRBR, FRBRoo, CIDOC CRM, etc. Parmi ces modèles, le CIDOC estune référence conceptuelle, modèle spécialement conçu pour la modélisation du patrimoine culturel. Ce modèle offre en effet un schéma commun de métadonnées rendant les concepts compréhensibles et interopérables.Afin d'aider les experts du domaine à produire et fournir des contenus numériques, nous adoptons une méthodologie en trois étapes qui permet de construire semi-automatiquement une représentation sémantique d'un domaine étudié à partir de documents hétérogènes. Tout d'abord, nous recueillons et formalisons l'historique par le biais d'entretiens avec les acteurs du domaine. Deuxièmement, notre système opère l'identification et l'extraction d'informations relatives au patrimoine culturel industriel à partir de milliers de documents textuels hétérogènes collectés auprès de ces acteurs (interviews, articles de journaux, etc.). L'approche proposée combine la projection lexicale avec des méthodes de fouille de textes pour améliorer l'identification de l'information pertinente. Enfin, nous présentons une première version de l'ontologie construite automatiquement au format OWL en utilisant le modèle CIDOC CRM comme base conceptuelle, pour fusionner toutes les informations extraites. Les expériences sont menées sur un corpus relatif au patrimoine industriel textile collecté grâce au projet DENIM.
- Subjects :
- [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
patrimoine industriel textile
recherche collaborative
Mémoire orale
base de connaissances
histoire
[SHS.INFO]Humanities and Social Sciences/Library and information sciences
[INFO.INFO-WB]Computer Science [cs]/Web
données ouvertes
ComputingMilieux_MISCELLANEOUS
cartographie des acteurs
Subjects
Details
- Language :
- French
- Database :
- OpenAIRE
- Journal :
- La fabrique numérique des corpus en sciences humaines et sociales, La fabrique numérique des corpus en sciences humaines et sociales, A paraître, Colloque « Corpus et archives numériques »-DHNord2019, Colloque « Corpus et archives numériques »-DHNord2019, Oct 2019, Lille, France
- Accession number :
- edsair.dedup.wf.001..d0782a2d8833cc5c523ea99da47927bf