Dord-Crouslé, Stéphanie, Littérature, idéologies, représentations, XVIIIe-XIXe siècles (LIRE), Université Stendhal - Grenoble 3-École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-Université Jean Monnet [Saint-Étienne] (UJM)-Centre National de la Recherche Scientifique (CNRS), Consortium CAHIER (CAHIER), Huma-Num : la TGIR des humanités numériques (Huma-Num), Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS), ANR (Agence Nationale de la Recherche - France), and ANR-07-CORP-0009,BOUVARD,Les Dossiers de Bouvard et Pécuchet de Flaubert. Enrichissement, valorisation, documentation d'un corpus multi supports(2007)
Project title The possible second volumes for Flaubert's unfinished novel Bouvard et Pécuchet Challenges and objectives The aim was to use the online publication of the preparatory documents left by the author to explore possible endings for this unfinished novel. The BOUVARD project made it possible to publish a fragile and complex patrimonial set (combining manuscripts, printed and mixed materials) of high scientific and cultural significance on a dedicated website (http://dossiers-flaubert.ish-lyon.cnrs.fr/). This set is comprised of the documentation files that Flaubert gathered to write his last novel. These 2400 sheets are now kept at the Rouen library in the form of eight collections of various documents and two additional collections dedicated to the Dictionnaire des idées reçues. The online availability (through images and transcriptions) of a corpus that used to be very hard to access is accompanied by noteworthy scientific enrichments (search engine, metadata, annotations, and libraries). Its main asset is an original computing device producing configurable arrangements of quotations extracted from the published documents. Among other arrangements, web users can produce hypothetical reconstructions of Bouvard et Pécuchet's second volume. Flaubert had partially planned this volume and started to gather material, but death prevented him from completing the work. Methods or technologies Thanks to the full XML-TEI encoding of the corpus, the site offers both a multi-format online edition and a tool producing arrangements of quotations. The corpus has been transcribed by the scientific project team and then encoded in XML-TEI, a free and open computer language that seeks to describe the logical structure of documents and to identify there different components. Thanks to this choice, the edition site offers several ways of visualizing each document from a single digital file. The site also offers a technical solution for the other part of the project geared toward the hypothetical reconstructions of the second volume of Bouvard et Pécuchet: it allowed to cut virtually the corpus into autonomous text fragments (according to the logic that Flaubert had already partially implemented when he began to write his "critical and farcical encyclopedia"), while ensuring that each fragment is connected both to the image area which it transcribes, and to the different textual units to which it belongs, such as the page where the fragment appears. Stored in a relational database, fragments can be gathered and organized according to various research hypotheses. The resulting arrangements of quotations (possible second volumes) may be exported in XML or PDF. Major results Bouvard et Pécuchet documentary files (text and images) are fully available on a dedicated website. Besides several tools (search engine and libraries), the site provides access to a corpus of 2400 pages transcribed in four formats: ultra-diplomatic, diplomatic, normalized and enriched. It also allows readers to produce arrangements of quotations on demand, including possible second volumes of Flaubert's unfinished novel. As a composition and structuring tool of the published work itself, this project seeks to extend the benefits of a critical edition to fragmentary textual contents. Scientific production Five conferences (organized in France, Italy and Japan) took place during the project which was also the source of more than 50 publications. Results are available to the scientific community at large (articles are deposited in the open access archive HAL, free data access is offered on the project's website) and attention was paid to sustainability and interoperability of corpus data through the use of the international, free and open encoding standard XML-TEI. Factual information The BOUVARD project is a basic research project completed by an international team of scientists and scholars under the leadership of Stéphanie Dord-Crouslé, a researcher in the UMR 5611 LIRE (Literature, Ideologies and Representations in the 18th and 19th centuries). Its technical implementation was carried out by the ISH (Institute for Human Sciences). The project began in January 2008 and lasted 54 months. It was supported by an ANR grant in the amount of 150 000 Euros for a full cost of about 900 000 Euros.; Titre du projet Les seconds volumes possibles de Bouvard et Pécuchet, roman inachevé de Flaubert Enjeux et objectifs L'objectif était de construire, à partir de l'édition des documents préparatoires laissés par l'auteur, des fins possibles pour ce roman inachevé. La réalisation du projet BOUVARD a permis d'éditer sur un site dédié (http://dossiers-flaubert.ish-lyon.cnrs.fr/) un ensemble patrimonial fragile et complexe (mélangeant les supports manuscrits, imprimés et mixtes), d'importance scientifique et culturelle reconnue : les dossiers documentaires constitués par Flaubert en vue de la rédaction de son dernier roman, conservés aujourd'hui à la bibliothèque municipale de Rouen sous la forme de huit recueils de documents divers auxquels s'ajoutent deux recueils concernant le Dictionnaire des idées reçues, soit 2400 feuillets. La mise à disposition sur Internet (sous forme d'images et de transcriptions) de ce corpus auparavant très difficile d'accès s'accompagne d'un enrichissement scientifique conséquent (moteur de recherche, métadonnées, annotations et bibliothèques) dont le point d'orgue est un dispositif informatique original permettant de créer des agencements paramétrables de citations extraites des documents édités. Les internautes peuvent ainsi produire, entre autres agencements, des reconstitutions conjecturales du second volume de Bouvard et Pécuchet, un volume dont Flaubert avait partiellement conçu le plan et commencé à réunir la matière mais que la mort l'a empêché de rédiger. Méthodes ou technologies utilisées Grâce à l'encodage XML-TEI intégral du corpus, le site propose à la fois une édition en ligne multi-format et un outil de production d'agencement de citations. Transcrit par l'équipe scientifique du projet, le corpus a été encodé en XML-TEI, un langage informatique libre et ouvert qui s'attache à décrire la structure logique des documents et à en identifier les différents éléments constitutifs. Ce choix permet de proposer sur le site d'édition, à partir d'un même fichier numérique, plusieurs types de visualisation pour chaque document. Il offre aussi une réponse technique à l'autre versant du projet visant à produire des reconstitutions conjecturales du second volume de Bouvard et Pécuchet : il a permis de découper virtuellement le corpus en fragments textuels autonomes (selon la logique que Flaubert avait déjà partiellement mise en œuvre en vue de la rédaction de son " encyclopédie critique en farce "), tout en veillant à ce que chaque fragment reste relié à la fois à la zone d'image dont il présente la transcription et aux différentes unités textuelles dont il est partie prenante (comme la page où se situe le fragment). Stockés dans une base de données relationnelle, les fragments peuvent être convoqués et organisés selon diverses hypothèses de recherche. Les agencements de citations produits (les seconds volumes possibles) sont exportables au format XML ou PDF. Résultats majeurs Le corpus des dossiers documentaires de Bouvard et Pécuchet (texte et images) est intégralement disponible sur un site web dédié. Accompagné de plusieurs outils (moteur de recherche et bibliothèques), le site donne accès à la transcription des 2400 pages du corpus sous quatre formats : ultra-diplomatique, diplomatique, normalisé et enrichi. Il permet aussi de produire des agencements de citations à la demande, dont des seconds volumes possibles pour le roman inachevé de Flaubert. Outil de composition et de structuration de l'œuvre éditée elle-même, cette réalisation présente une tentative pour étendre le champ de l'édition critique aux contenus textuels fragmentaires. Production scientifique La réalisation du projet s'est accompagnée de la tenue de cinq colloques (organisés en France, Italie et Japon) et est à l'origine de plus de 50 publications diverses. Les résultats sont à la disposition de la communauté scientifique (dépôt des articles dans l'archive ouverte HAL, accès libre aux données sur le site web du projet) et on a veillé à la pérennité et à l'interopérabilité des données produites en utilisant pour l'encodage du corpus le standard international, libre et ouvert, XML-TEI. Informations factuelles Le projet BOUVARD est un projet de recherche fondamentale réalisé par une équipe scientifique internationale sous la direction de Stéphanie Dord-Crouslé, chargée de recherche dans l'UMR 5611 LIRE (Littérature, Idéologies, Représentations, XVIIIe-XIXe siècles). Sa mise en œuvre technique a été opérée par l'ISH (Institut des Sciences de l'Homme). Le projet a commencé en janvier 2008 et a duré 54 mois. Il a bénéficié de la part de l'ANR d'une aide de 150 000 euros pour un coût complet de l'ordre de 900 000 euros.