Skip to content
Bertrand Caron edited this page Apr 21, 2021 · 21 revisions

XML-tdmNum Statut

Description

Le format tdmNum est développé et utilisé par la BnF pour la transcription des tables et index présents dans les ouvrages numérisés. Cette transcription reproduit la structure logique des contenus, identifie les intitulés des entrées ainsi que leurs liens vers le corps des ouvrages. Elle permet également de repérer les entités (personne, toponyme, organisation) éventuellement nommées dans les intitulés.

Sociabilité

Ce format n'est utilisé que dans le contexte des activités de numérisation de la BnF et de ses partenaires. Pour ces derniers, le respect de ce format garantit que leurs tables et index seront intégrés dans la chaîne d'entrée des documents numériques de la BnF et valorisés dans Gallica.

Relations à d’autres formats

Le format tdmNum est une restriction du format TEI, lui-même schéma de données structurées en XML. La sémantique du jeu de balises utilisé est décrite dans le référentiel de numérisation (voir ci-après).

Versions

Seule la version 1.1 du format tdmNum est utilisée.

Organisme de maintenance et documentation de référence

Le format est maintenu par la BnF, diffusé sur le site bibnum.bnf et décrit dans un des référentiels de numérisation de la BnF, Traitement des tables.

Identifiants

Ce format local n'a pas reçu d'identifiant international.

Métadonnées internes

Le format tdmNum n'embarque pas de métadonnées internes, si ce n'est l'identifiant du document numérique dont il décrit la table des matières ou l'index.

Outils connus par la BnF

La validation du format est réalisée par le moyen d'un schéma XSD.

La caractérisation de tdmNum, comme celle des autres formats XML, est réalisée par le module XML de l'outil Jhove. L'option withTextMD permet de produire une sortie au format textMD.

Usage ou présence dans les collections de la BnF

Ce format est en usage dans le cadre des marchés et programmes de numérisation de la BnF. Il sert à transcrire les tables et index des ouvrages numérisés ainsi que les plages des enregistrements sonores.

La fonctionnalité de navigation au sein des documents de Gallica (exemple sur un ouvrage imprimé, exemple sur un document sonore) utilise les transcriptions produites selon ce format.

Clone this wiki locally