Du bruit au signal (et inversement)

Aller au contenu | Aller au menu | Aller à la recherche

mardi 5 janvier 2010

Les métadonnées embarquées dans les documents PDF

Résumé : Depuis son introduction en 1993, le format PDF supporte un jeu très simple de métadonnées internes habituellement nommé Document Info. Il s'agit de six champs textuels libres qui décrivent le document et son moyen de production (Titre, Auteur, Sujet, Mots-clés, Producteur du PDF, Application) et deux champs de type date (Date de création, Date de modification). Adobe a ensuite défini XMP en 2001 et introduit cette dernière technologie progressivement dans tous les formats de fichiers gérés par ses applications. Les documents PDF supportent donc désormais deux types de métadonnées embarquées : le Document Info « historique » et les informations XMP beaucoup plus élaborées. Ce billet décrit trois caractéristiques permettant d'évaluer si un logiciel gère correctement ces métadonnées.

Lire la suite...

lundi 30 novembre 2009

La (non) préservation des métadonnées des images sur les médias sociaux

Le groupe ControlledVocabulary publie un tableau utile qui récapitule comment les métadonnées Exif, IPTC et XMP sont (mal)traitées lors du chargement des images sur les plates-formes suivantes : Facebook, Twitter, Wordpress, Flickr, Windows Live Photo, Picasa Web Albums, Smugmug.

C'est ici.

Ajouté le 2/12/2009 : la méthodologie suivie est décrite ici.

vendredi 27 novembre 2009

L’information embarquée dans l’image numérique

J'ai effectué le 25 novembre dernier une présentation intitulée L’information embarquée dans l’image numérique lors de la conférence "Quel avenir pour nos images numériques ?". Cette très brève introduction (18 diapositives) aux métadonnées Exif (et GPS), IPTC/IIM et XMP des images numériques est disponible :

La conférence était organisée à la Maison Européenne de la Photographie à l'occasion de la sortie du livre de Daniel Hennemand Gérer ses photos numériques - Trier - Archiver - Partager qui vient de paraître aux Éditions Eyrolles.

dimanche 8 février 2009

The Commons sur Flickr, quelques chiffres

Le projet The Commons (“les Organismes publics” en français) a été lancé le 16 Janvier 2008 avec la publication sur Flickr de près de 3000 photographies de deux collections de la Library of Congress. Les objectifs de ce projet sont d'accroître l'accès aux collections détenues par des institutions du monde entier et de fournir au public un moyen lui permettant de contribuer à l'amélioration de la description de ces collections.
Pour en savoir plus: A Commons Bibliography sur le blog indicommons

Sur chaque photo, un utilisateur peut proposer:

Je donne ci-dessous quelques indications chiffrées sur le nombre de commentaires, tags, notes et machines tags pour chacune des institutions qui participent actuellement (chiffres collectés les 7 et 8 février 2009).
Quelques renseignements partiels sont aussi donnés sur le support des métadonnées IPTC et XMP dans chacune de ces collections.

(modifié le 21 février 2009 pour le Brooklyn Museum)

Lire la suite...

samedi 17 janvier 2009

Adobe ouvre la voie à de nouvelles applications pour la vidéo avec XMP Library for ActionScript

Adobe poursuit sa stratégie de développement XMP en direction de la vidéo et vient de publier le premier preview de XMP Library for ActionScript.

Le code est basé sur la bibliothèque XMPCore utilisée pour traiter et gérer les métadonnées XMP et permet de les lire dans les fichiers SWF, FLV et F4V (avec Flash Player 10 uniquement).

Les applications CS4 permettent de capturer un grand nombre de métadonnées dans le processus de production et de les rendre disponibles dans les fichiers FLV ou F4V. Ces fichiers vidéo enrichis d'informations peuvent donc désormais être exploités dans les applications Flex grâce à cette bibliothèque.

Puisque la fonction de transcription vocale automatique (Speech To Text) des logiciels Premiere Pro et Soundbooth permet de convertir les dialogues de séquences vidéo (ou audio) en métadonnées texte, il devient ainsi possible par exemple de lire les métadonnées stockées dans un fichier vidéo et de les afficher automatiquement en synchronisation avec la lecture de la vidéo, de rechercher des métadonnées dans un fichier Flash pour commencer la lecture à un mot précis d’un dialogue, etc.

Lorsque les données GPS sont capturées, il est aussi possible de créer un widget Flex affichant dynamiquement une carte figurant les endroits où la vidéo a été prise.

Pour reprendre les termes de Gunar Penikis, les métadonnées XMP doivent maintenant être fondamentalement pensées comme un autre moyen de communication (another communication channel) facilement accessible et connecté à d'autres ressources Web pour construire de nouvelles applications.

SourceXMP Library for ActionScript on Labs (From Gunar)

vendredi 19 décembre 2008

Nature publie des articles contenant des métadonnées XMP

La revue Nature publie désormais des articles au format PDF contenant des métadonnées XMP.

We now have a complete bibliographic record (including DOI) embedded in the PDF using structured markup. And, moreover, we also have a solid bedrock for adding in any additional metadata should the need arise. This semantic labelling is available on all new issues of Nature and will be added to other NPG titles over the coming months.

Comme on peut le voir sur cet exemple, cet enrichissement sémantique s'appuie sur le vocabulaire PRISM (Publishing Requirements for Industry Standard Metadata), développé par IDEAlliance, qui complète les schémas habituels (Dublin Core, etc.).

Encore un exemple de l'importance croissante que prend XMP comme je le disais dans un récent billet.

Sources:
Nature Now as XMP sur Catalogablog
XMP labelling for Nature sur Nascent, le blog de Nature

- page 1 de 4