Le Projet Notre-Dame consiste en une transcription des journaux quotidiens de l'année 1860 des travaux de restauration effectués de 1844 à 1865 à la cathédrale Notre-Dame de Paris sous la direction d'Eugène Viollet-le-Duc et Jean-Baptiste Lassus. Celle-ci a été effectuée sur eScriptorium à partir de la numérisation des journaux des travaux réalisée par la Médiathèque de l'architecture et du patrimoine.
Le projet a été réalisé dans le cadre du cours GIT du master 2 TNAH de l'École nationale des chartes. Ses données sont disponibles dans le dossier data.
Le projet Notre-Dame a été réalisé par Soline Doat, Elsa Falcoz, Margaux Faure, Anaïs Mazoué et Ariane Menu. Si nécessaire, nous vous prions de vous référer au fichier CITATION.cff
pour citer le projet.
- respect des majuscules et minuscules
- respect des ligatures (par exemple, transcrire "chœur")
- mot qui est barré : 难 (une seule fois par mot) mais seulement s'ils sont totalement/à moitié illisibles. Les restranscrire entre accolades {} s'ils sont lisibles.
- Pour mettre en exergue les doutes de transcription :
- mot incertain: [incertain]
- mot que l'on ne parvient pas à transcrire : [??]
- Anaïs : pages 1 à 3 (relues par Ariane)
- Soline : pages 4 et 5 (relues par Anaïs)
- Ariane : pages 6 et 7 (relues par Soline)
- Elsa : pages 8 et 9 (relues par Margaux)
- Margaux : pages 10 à 12 (relues par Elsa)
Versions utilisées et considérations techniques :
- eScriptorium : Version Wed Dec 8 10:53:11 CET 2021 - a64ba80255ddab851728cbdc2427f701902901c7
- Kraken : Version 3.0.5
- Modèle de transcription utilisé : Kraken: Modèle Manuscrit 19e Lectaurep
- Format d'export des transcriptions : ALTO (XML) et Text
Application des zones :
- une zone principale qui constitue le corps du texte : "main"
- une zone marge : "marge"
- une zone pour encadrer les illustrations : "illustrations"
- une zone pour délimiter le numéro de folio : "folio"
- une zone pour délimiter les tableaux : "table"
- Un lexique regroupant le vocabulaire architectural, une capture du mot et sa définition est disponible dans le repository.
- Un tutoriel pour la bonne numérotation des lignes est disponible ici.
- une branche par personne
- Un dossier par page, nommé comme suit pour la page 1 : "NDP_page01". Il comprend un fichier xml, un fichier txt et une image png.
- les fichiers xml doivent se nommer comme suit : NDP_page01.xml
- les fichiers txt doivent se nommer comme suit : NDP_page01.txt
- les images png doivent se nommer comme suit : NDP_page01.png
- pour toute demande d'aide en transcription (mots incertains, illisibles...) : créer une issue pour chaque page pour y répertorier les difficultés
- ne pas oublier d'ajouter dans le lexique (lexique_architectural.md) les mots spécifiques au domaine de l'architecture qui ont posé des problèmes de transcription.