Résumé : Depuis son introduction en 1993, le format PDF supporte un jeu très simple de métadonnées internes habituellement nommé Document Info. Il s'agit de six champs textuels libres qui décrivent le document et son moyen de production (Titre, Auteur, Sujet, Mots-clés, Producteur du PDF, Application) et deux champs de type date (Date de création, Date de modification). Adobe a ensuite défini XMP en 2001 et introduit cette dernière technologie progressivement dans tous les formats de fichiers gérés par ses applications. Les documents PDF supportent donc désormais deux types de métadonnées embarquées : le Document Info « historique » et les informations XMP beaucoup plus élaborées. Ce billet décrit trois caractéristiques permettant d'évaluer si un logiciel gère correctement ces métadonnées.
Tag - XMP
mardi 5 janvier 2010
Les métadonnées embarquées dans les documents PDF
Par Patrick Peccatte le mardi 5 janvier 2010, 10:58 - métadonnées
lundi 30 novembre 2009
La (non) préservation des métadonnées des images sur les médias sociaux
Par Patrick Peccatte le lundi 30 novembre 2009, 08:40 - métadonnées
Le groupe ControlledVocabulary publie un tableau utile qui récapitule comment les métadonnées Exif, IPTC et XMP sont (mal)traitées lors du chargement des images sur les plates-formes suivantes : Facebook, Twitter, Wordpress, Flickr, Windows Live Photo, Picasa Web Albums, Smugmug.
C'est ici.
Ajouté le 2/12/2009 : la méthodologie suivie est décrite ici.
vendredi 27 novembre 2009
L’information embarquée dans l’image numérique
Par Patrick Peccatte le vendredi 27 novembre 2009, 15:35 - métadonnées
J'ai effectué le 25 novembre dernier une présentation intitulée L’information embarquée dans l’image numérique lors de la conférence "Quel avenir pour nos images numériques ?". Cette très brève introduction (18 diapositives) aux métadonnées Exif (et GPS), IPTC/IIM et XMP des images numériques est disponible :
- sur Slideshare
- sur Scribd
La conférence était organisée à la Maison Européenne de la Photographie à l'occasion de la sortie du livre de Daniel Hennemand Gérer ses photos numériques - Trier - Archiver - Partager qui vient de paraître aux Éditions Eyrolles.
dimanche 8 février 2009
The Commons sur Flickr, quelques chiffres
Par Patrick Peccatte le dimanche 8 février 2009, 12:21 - métadonnées
Le projet The Commons (“les
Organismes publics” en français) a été lancé le 16 Janvier 2008 avec la
publication sur Flickr de près de 3000 photographies de deux collections de la
Library of
Congress. Les objectifs de ce projet sont d'accroître l'accès aux
collections détenues par des institutions du monde entier et de fournir au
public un moyen lui permettant de contribuer à l'amélioration de la description
de ces collections.
Pour en savoir plus: A Commons
Bibliography sur le blog indicommons
Sur chaque photo, un utilisateur peut proposer:
- des commentaires
- des tags
- des notes associées à des zones de la photo
- des machines tags (voir mon billet Un nouveau projet documentaire basé sur Flickr: accessCeramics pour une explication des machine tags)
Je donne ci-dessous quelques indications chiffrées sur le nombre de
commentaires, tags, notes et machines tags pour chacune des institutions qui
participent actuellement (chiffres collectés les 7 et 8 février 2009).
Quelques renseignements partiels sont aussi donnés sur le support des
métadonnées IPTC et XMP dans chacune de ces collections.
(modifié le 21 février 2009 pour le Brooklyn Museum)
samedi 17 janvier 2009
Adobe ouvre la voie à de nouvelles applications pour la vidéo avec XMP Library for ActionScript
Par Patrick Peccatte le samedi 17 janvier 2009, 10:51 - métadonnées
Le code est basé sur la bibliothèque XMPCore utilisée pour traiter et gérer les métadonnées XMP et permet de les lire dans les fichiers SWF, FLV et F4V (avec Flash Player 10 uniquement).
Les applications CS4 permettent de capturer un grand nombre de métadonnées dans le processus de production et de les rendre disponibles dans les fichiers FLV ou F4V. Ces fichiers vidéo enrichis d'informations peuvent donc désormais être exploités dans les applications Flex grâce à cette bibliothèque.
Puisque la fonction de transcription vocale automatique (Speech To Text) des logiciels Premiere Pro et Soundbooth permet de convertir les dialogues de séquences vidéo (ou audio) en métadonnées texte, il devient ainsi possible par exemple de lire les métadonnées stockées dans un fichier vidéo et de les afficher automatiquement en synchronisation avec la lecture de la vidéo, de rechercher des métadonnées dans un fichier Flash pour commencer la lecture à un mot précis d’un dialogue, etc.
Lorsque les données GPS sont capturées, il est aussi possible de créer un widget Flex affichant dynamiquement une carte figurant les endroits où la vidéo a été prise.
Pour reprendre les termes de Gunar Penikis, les métadonnées XMP doivent maintenant être fondamentalement pensées comme un autre moyen de communication (another communication channel) facilement accessible et connecté à d'autres ressources Web pour construire de nouvelles applications.
Source: XMP Library for ActionScript on Labs (From Gunar)
vendredi 19 décembre 2008
Nature publie des articles contenant des métadonnées XMP
Par Patrick Peccatte le vendredi 19 décembre 2008, 19:40 - édition
La revue Nature publie désormais des articles au format PDF contenant des métadonnées XMP.
We now have a complete bibliographic record (including DOI) embedded in the PDF using structured markup. And, moreover, we also have a solid bedrock for adding in any additional metadata should the need arise. This semantic labelling is available on all new issues of Nature and will be added to other NPG titles over the coming months.
Comme on peut le voir sur cet exemple, cet enrichissement sémantique s'appuie sur le vocabulaire PRISM (Publishing Requirements for Industry Standard Metadata), développé par IDEAlliance, qui complète les schémas habituels (Dublin Core, etc.).
Encore un exemple de l'importance croissante que prend XMP comme je le disais dans un récent billet.
Sources:
Nature Now
as XMP sur Catalogablog
XMP
labelling for Nature sur Nascent, le blog de Nature
« billets précédents - page 1 de 4