Systèmes éditoraux: être clair quand on parle de XML
Par Patrick Peccatte le vendredi 8 février 2008, 18:36 - XML et technologies associées - Lien permanent
Le billet précédent où je m'étonne que certains discours sur XML me paraissent parfois un peu confus dans le domaine des systèmes éditoriaux me conduit à mentionner deux articles maintenant un peu anciens (car tout évolue vite bien sûr):
- l'étude XML et les formats de traitement de texte et de mise en page, au format PDF, que j'ai réalisé pour l'IFRA et dont la dernière révision date d'octobre 2006. Certaines descriptions de systèmes mentionnés ne correspondent plus aux dernières versions des fournisseurs (pardon Carlos et Michela de ressortir ce papier...), mais la typologie proposée des outils de mise en page et des traitements de textes au regard de leurs capacités XML me semble toujours actuelle.
- l'étude XML and
databases par Ronald Bourret, dont la dernière révision date de septembre
2005; j'avais traduit en français cet article en 2003. Cette étude essentielle,
qu'il est préférable de lire en anglais (!), est assez difficile parfois, mais
la lecture en vaut la peine car elle introduit des critères objectifs
concernant les capacités XML des bases de données; l'expression "base de
données XML native" prend tout son sens dans cet article, et pour être ainsi
qualifiée, une base de données doit répondre à des caractéristiques bien
précises. Je n'en citerai que deux ici, la notion de "collection de documents"
et le "round-tripping":
« De nombreuses bases XML natives supportent la notion de collection.
Ce concept joue un rôle similaire à la table dans une base de données
relationnelle ou au répertoire dans un système de fichiers. Supposons par
exemple que vous utilisiez une base XML native pour stocker des ordres de
ventes. Dans ce cas, vous devriez définir une collection ordres de ventes de
telle manière que les recherches sur des ordres de ventes soient limitées aux
documents de cette collection.../...
Une caractéristique importante des bases XML natives est qu’elles permettent
l’aller-retour des documents (Round-Tripping). Cela signifie que l’on peut
stocker un document XML dans une base XML native et obtenir à nouveau le "même"
document. Cette propriété est importante pour les applications orientées
document pour lesquelles des choses comme les sections CDATA, l’utilisation des
entités, les commentaires, et les instructions de traitement sont parties
intégrantes du document. Elle est également cruciale pour de nombreuses
applications légales et médicales qui doivent conserver légalement des copies
exactes des documents.../... Toutes les bases XML natives permettent
l’aller-retour des documents au niveau des éléments, des attributs, des PCDATAs
et de l’ordre interne du document. Les possibilités supplémentaires en matière
d’aller-retour dépendent de la base considérée. » (R. Bourret)