série de livres illustrant la documentation structurée

Base de données documentaires

Si les données, entre autres numériques, sont usuellement stockées dans les tables des bases de données, il existe différentes architectures d'archivage pour les documents contenant du texte structuré.

Document en base de données

La base de données sous-jacente étant indifférente pour l'utilisateur final, plusieurs implémentations peuvent correspondre à une même spécification fonctionnelle. Aussi, différentes architectures techniques peuvent-elles être envisagées pour un projet documentaire.

Souvent, le document sera considéré comme un tout et stocké en tant qu'objet binaire, seules les informations de gestion de son cycle de vie étant affectées à des champs de la base de données.

Le contenu du document n'est alors pas directement accessible pour des extractions partielles ou des requêtes autres qu'en texte intégral.

Prise en compte de la structure du document

À l'opposé, de rares bases de données permettent l'accès direct à la structure du document. Ces bases assurent une meilleure cohérence des informations enregistrées.

Des informations de gestion, par exemple des applicabilités, peuvent être ainsi enregistrées dans le document en tant qu'éléments ou attributs du balisage SGML ou XML. Une structure spécifique au stockage en base est alors définie.

Lorsque la structure interne de la base repose sur XML, elle est qualifiée de Native XML Database (NXD) ou base de données XML native. Les interrogations peuvent alors s'effectuer en utilisant les langages XPath et XQuery.

Séparation du texte et des données

Entre les deux approches précédentes, il est possible de séparer la partie purement textuelle du document des données permettant de le caractériser. Ces dernières seront alors classiquement gérées par les tables de la base de données relationnelle, tandis que le texte structuré sera stocké en tant qu'objet binaire.

Cela n'empêche pas les échanges entre la base et les autres applications de s'effectuer sous forme d'un unique document structuré. Le texte constituant le corps du document ainsi que les données descriptives sont extraits depuis le format d'échange en entrée de la base et, inversement, fusionnés vers ce format en sortie.

Cette conception mixte peut offrir un bon compromis entre les possibilités d'interrogation, les performances de l'application et la complexité des technologies utilisées.

Illustrations

Les illustrations matricielles seront quant à elles traitées en tant qu'objet binaire. Dans le cas où une consultation interactive est envisagée, les informations permettant de définir les zones des illustrations servant de source ou de destination à un lien devront figurer parmi les caractéristiques stockées dans des tables de la base.

L'archivage de l'illustration en plusieurs résolutions peut aussi être envisagé, les versions en basse résolution étant alors destinées aux publications électroniques tandis que les versions en haute résolution serviront pour les documentations imprimées.

Valid XHTML 1.1

Toute copie, y compris partielle, des textes et photos de ce site est interdite.

© Boriva 2004-2022Mentions légalesContact