Un bref historique

L'IPTC a publié en 1991 le modèle de métadonnées IIM (Information Interchange Model), repris sous une forme simplifiée par Adobe dans son logiciel Photoshop. Les "champs IPTC" se sont alors rapidement imposés, dans les secteurs de la presse et de l'édition, comme un standard de description des informations concernant les images fixes. Ce modèle IPTC/IIM possède néanmoins d'importantes limitations: il n'est pas extensible de façon documentée, les longueurs des champs sont limités, la méthode n'est pas adaptée aux légendes multilingues, et enfin, on rencontre très souvent des problèmes de codages d'accents entre les différentes plates-formes. Adobe a donc créé en 2001 un nouveau format de métadonnées nommé XMP (eXtensible Metadata Platform), basé sur des standards du Web (RDF et Dublin Core) et qui ne présente pas ces inconvénients. En 2005, l'IPTC a adopté cette technologie comme base d'un nouveau standard nommé IPTC Core qui succède ainsi officiellement à l'IIM. L'extensibilité des schémas XMP a permis à l'IPTC d'aller au delà de la simple transcription de l'IIM selon cette nouvelle technologie en proposant de nouveaux champs. Mais malgré ces nouvelles possibilités, les spécialistes de l'indexation des images ne se sont pas véritablement approprié XMP; et de fait, cette nouvelle technologie est apparue parfois comme une source de soucis supplémentaires dans la chaîne de production d'images légendées, à cause essentiellement des incohérences qui peuvent s'introduire dans un workflow quand on utilise successivement un logiciel supportant XMP et un logiciel ne le supportant pas.

Au cours de l'année 2008, plusieurs initiatives dans le domaine des standards ainsi que le lancement de la suite CS4 devraient conduire à une généralisation de cette technologie XMP initiée il y a maintenant 7 ans et à laquelle tous les acteurs majeurs de l'indexation des images fixes se sont ralliés: Camera Bits (Photo Mechanic), FotoWare (FotoStation), Breeze Systems, Metamachine, etc. (cf. la liste Software supporting IPTC photo metadata standards IIM and "IPTC Core"). Même Microsoft semble avoir compris qu'il était vain de tenter d'imposer une technologie concurrente sur cette question (cf. le billet Microsoft Pro Photo Tools 2 et le support de XMP).

Rappels d'initiatives récentes concernant les métadonnées des images fixes

IPTC Photo Metadata 2008

Ce standard a été adopté par l'IPTC en juillet 2008. Il complète l'IPTC Core qui évolue en version 1.1. Un nouveau schéma IPTC Extension 1.0 fait son apparition à cette occasion et propose de nombreux champs nouveaux, en particulier en ce qui concerne l'autorisation des modèles photographiés (model release) et la propriété du contenu (property release); ces nouveaux champs relatifs à la gestion des droits et licences sont contrôlés selon le modèle PLUS (voir ci-dessous).
Des panneaux de saisies personnalisés (customs panels) seront proposés ultérieurement pour les versions CS3 et CS4 de la suite d'Adobe.
cf. le billet IPTC Photo Metadata 2008 

PLUS

PLUS (Picture Licensing Universal System) est une initiative issue de la coopération de plusieurs industriels du monde de l'image fixe. Il s'agit d'un système permettant de définir et catégoriser clairement les usages des images dans le monde entier, et de spécifier l'acquisition de licences pour le suivi et la gestion de ces images. PLUS repose sur un glossaire de termes contenant les définitions d’utilisation des images, et une grille (media matrix) codifiée, normalisée et hiérarchisée, de ces utilisations: « un identifiant alphanumérique d’utilisation (UID) est assigné à chacune de ces utilisations, générales ou spécifiques, permettant de saisir immédiatement et avec précision la portée d'une autorisation. L'UID permet également de suivre de manière complètement automatisée l’usage d’une image dans un système de base de données et, potentiellement, de la suivre grâce aux métadonnées incorporées dans l’image elle-même. »

PLUS, qui ne traite pas du prix ou de la vente des images, est un système complexe et a longtemps été considéré comme une sorte de vaporware sans réelle implémentation. Plusieurs annonces importantes sont néanmoins intervenues en 2008 pour conforter PLUS, en particulier:

  • Les éditeurs McGraw Hill, Houghton Mifflin Harcourt, et Pearson viennent d'annoncer qu'ils adoptent les définitions du glossaire PLUS et encouragent leurs fournisseurs à intégrer des métadonnées PLUS dans toutes leurs images dans un délai d'un an. Cette encapsulation de métadonnées PLUS utilisera XMP.
  • L'ACAP (Automated Content Access Protocol), qui définit un protocole permettant aux éditeurs de contrôler la réutilisation de leurs contenus, vient d'adopter les standards définis dans PLUS. Il en est de même pour les plates-formes de gestion de droits LicenseStream et ImageSpan
  • L'IPTC vient d'adopter Photo Metadata 2008 dont une partie du vocabulaire reprend celui de PLUS (voir ci-dessus).

PLUS devient donc une initiative importante notamment à travers la gestion de ses métadonnées propres. Il concerne essentiellement le marché américain mais tous les producteurs de contenus qui souhaitent être présents sur celui-ci devront probablement en tenir compte.

Metadata Working Group

Le principal objectif du Metadata Working Group est de préciser la manière dont les métadonnées sont échangées et conservées quand elles changent d'applications, de processus (matériels, services et plates-formes), de formats de fichiers ou de standards de métadonnées. Le document de travail récemment produit par ce groupe propose de meilleures pratiques concernant 9 champs fondamentaux: les mots-clés, la description, la date et l'heure, l'orientation, l'évaluation, le copyright, le créateur, et deux types de localisations distinctes [l'endroit de la prise de vue et ce qui est montré], avec pour objectif de résoudre les problèmes d'interopérabilité que rencontrent les utilisateurs.
cf. le billet First Specification for Interoperability and Preservation of Metadata in Digital Photography

Les métadonnées XMP pour l'image fixe en CS4

Depuis la version CS3, l'application Bridge reprend les fonctionnalités élargies de métadonnées propres à Ligthroom, en particulier:

  • le rating: étoiles attribuées à chaque image
  • les mots-clés hiérarchisés: ces mots-clés sont gérés en XMP dans un espace de nom spécifique et répliqués deux fois sans hiérarchisation (dans l'espace XMP Dublin Core et en IIM).

Ces fonctionnalités intéressantes furent contestées lorsqu'elles ont apparues puisqu'elles n'existent pas en IPTC Core. Leur confirmation en CS4 impose donc quelques précautions dans un workflow d'indexation où d'autres logiciels interviennent.

La version CS4 introduit une nouvelle méthode de développement des panneaux de saisie des métadonnées (custom panels) basée sur Flex. Bien que cela rende plus complexe le travail des développeurs puisqu'ils devront maintenir, le cas échéant, deux versions de panneaux, cette nouveauté introduit plus de souplesse pour l'écriture d'outils spécifiques d'indexation en utilisant la connectivité de Flash. Il est ainsi possible à l'aide de cette ouverture permise par Flash d'accéder à des vocabulaires contrôlés centralisés pour l'indexation depuis Bridge ou tout autre composant de la suite CS4.

Adobe a aussi introduit des fonctionnalités avancées, par exemple la possibilité d'associer des métadonnées non plus seulement au niveau du document mais aussi au niveau de chaque calque. Ceci permettra de journaliser l'historique d'un travail collectif sur un document, une image, une vidéo, etc., à l'aide de jeux spécifiques de métadonnées affectés indépendamment à chacun des calques.

Enfin, les développeurs disposent maintenant d'une extension appelée XMPScript permettant d'accéder depuis JavaScript à l'ensemble des métadonnées XMP en lecture et en écriture.

Les métadonnées XMP pour les formats audio et vidéo en CS4

Mais la grande nouveauté de CS4 en ce qui concerne les métadonnées est le support généralisé de XMP pour différents formats audio et vidéo. Le logiciel After Effects permet par exemple de stocker des métadonnées XMP dans ses propres formats (.aep, .aepx), dans les formats Flash (.flv et .f4v), QuickTime (.mov), vidéo pour Windows (.avi), Windows Media (.wmv) et certains formats mpeg (.mpg, .m2v, .mp4) [les métadonnées XMP sont enregistrées dans des fichiers annexes (.xmp) pour d'autres types de formats mpeg].

Adobe a considérablement étoffé les possibilités de XMP en publiant courant 2008 de nouveaux schémas et un nouveau guide d'implémentation concernant plusieurs formats multimédias. Le schémaDynamic Media, par exemple, inclut des propriétés telles que la scène et le lieu de la prise de vue qui sont adaptées à des projets vidéo numériques.

Les métadonnées audio et vidéo sont réparties en deux grandes catégories : les métadonnées statiques et les métadonnées temporelles. Les métadonnées statiques s’appliquent à l’ensemble du document audio ou vidéo. Par exemple, les informations de copyright et d’auteur d’un clip vidéo s’appliquent à tout le clip. Les métadonnées temporelles sont associées à un instant particulier dans un ensemble d’éléments de média dynamique (voir ici)

La fonction de transcription vocale automatique (Speech To Text) des logiciels Premiere Pro et Soundbooth permet de convertir les dialogues de séquences vidéo ou audio en métadonnées texte. Chaque mot est alors stocké sous la forme d’un élément de métadonnées XMP correspondant à un repère temporel du montage. Lorsqu’un fichier contenant des métadonnées de recherche vocale est importé dans After Effects et utilisé comme fichier source pour un calque, chaque mot apparaît alors dans un repère de calque au moment correspondant à l'occurrence du mot. Il est ainsi possible d'utiliser des métadonnées XMP depuis une application Flash sur le Web pour ajouter de l’interactivité à la lecture de vidéos dans Flash Player. Cette fonction permet notamment à l’utilisateur de rechercher des métadonnées temporelles dans un fichier Flash (.f4v), pour commencer par exemple la lecture à un mot précis d’un dialogue ou à tout autre instant associé à un élément de métadonnées temporelles spécifique.

Ajoutons enfin que l'IPTC vient également de lancer une consultation afin d'étudier la possibilité d'adapter son récent standard IPTC Photo Metadata à la vidéo.

En conclusion

Le discours récent d'Adobe concernant XMP va bien au delà d'une simple évolution technologique comme la société l'affirmait il y a encore quelques années: « XMP permet maintenant de suivre et monétiser les contenus, y compris sur le Web et pour la vidéo » affirme-t-on. La technologie apparaît désormais centrale dans la stratégie de l'éditeur. Nous allons donc vraisemblablement assister à une véritable montée en puissance de XMP pour l'ensemble des contenus multimédias et sur d'autres types d'applications que la description des images fixes. Il est encore difficile de juger si cet ensemble d'initiatives autour des métadonnées XMP seront toutes pleinement utilisées. Il semble clair cependant que l'infrastructure technologique mise en place il y a quelques années permet une véritable valorisation des contenus et l'émergence de nouveaux médias.