1. Transcription et codage des imprimés de la Renaissance. Réflexions pour un inventaire des caractères anciens
- Author
-
Jacques André, Rémi Jimenes, Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria), Centre d'études supérieures de la Renaissance UMR 7323 (CESR), and Ministère de la Culture et de la Communication (MCC)-Université de Tours-Centre National de la Recherche Scientifique (CNRS)
- Subjects
typèmes ,codage ,MUFI ,documents anciens ,[SHS.LITT]Humanities and Social Sciences/Literature ,[SHS.INFO]Humanities and Social Sciences/Library and information sciences ,typographie ,Library and Information Sciences ,encoding ,typems ,printed material ,caractères ,inventory ,Renaissance ,typography ,inventaire ,imprimés ,PICA ,types ,Unicode ,[SHS.LANGUE]Humanities and Social Sciences/Linguistics ,[SHS.HIST]Humanities and Social Sciences/History ,ancient document - Abstract
International audience; Preserving as many informations as possible from the original document, a transcription of ancient printed text should serve as a basis not only for literary analysis, but also for palaeotypographic studies. With this aim, we require a standardized encoding able to preserve a unequivocal link between the characters of the digital transcription and those of the original source. We define here the new concept of typem, a transitional element between the notion of character and glyph as defined by Unicode. It is proposed here to use MUFI, an extension to the Unicode standard, by adding new code points dedicated to "typems", in order to produce what we call "typemic transcriptions", reproducing all the characters of the original document. Finally, a project of a census of all the typems, named PICA (Projet d'Inventaire des Caractères Anciens), is described.; Conservant le plus grand nombre possible d'informations du document-source, une transcription de texte imprimé ancien devrait pouvoir servir de base non seulement à des analyses littéraires, mais également à des études " paléotypographiques ". Pour ce faire, il faudrait disposer d'un codage normalisé permettant d'assurer une correspondance univoque entre les caractères de la transcription numérique et ceux de la source originale. Le terme " caractère " pouvant prêter à confusion, nous introduisons un nouveau concept : celui de " typème ", intermédiaire entre le caractère et le glyphe tel qu'Unicode les définit. Nous proposons d'utiliser le codage MUFI, une extension d'Unicode, augmentée des typèmes attestés dans les imprimés anciens, afin de produire une transcription dite " typémique ", reproduction fidèle de la composition typographique du document original. Nous concluons sur la nécessité de réaliser l'inventaire des typèmes attestés dans les imprimés anciens, qui fera l'objet d'un Projet d'Inventaire des Caractères Anciens (PICA) actuellement à l'étude.
- Published
- 2013