Du bruit au signal (et inversement)

Aller au contenu | Aller au menu | Aller à la recherche

mardi 5 janvier 2010

Les métadonnées embarquées dans les documents PDF

Résumé : Depuis son introduction en 1993, le format PDF supporte un jeu très simple de métadonnées internes habituellement nommé Document Info. Il s'agit de six champs textuels libres qui décrivent le document et son moyen de production (Titre, Auteur, Sujet, Mots-clés, Producteur du PDF, Application) et deux champs de type date (Date de création, Date de modification). Adobe a ensuite défini XMP en 2001 et introduit cette dernière technologie progressivement dans tous les formats de fichiers gérés par ses applications. Les documents PDF supportent donc désormais deux types de métadonnées embarquées : le Document Info « historique » et les informations XMP beaucoup plus élaborées. Ce billet décrit trois caractéristiques permettant d'évaluer si un logiciel gère correctement ces métadonnées.

Lire la suite...

lundi 30 novembre 2009

La (non) préservation des métadonnées des images sur les médias sociaux

Le groupe ControlledVocabulary publie un tableau utile qui récapitule comment les métadonnées Exif, IPTC et XMP sont (mal)traitées lors du chargement des images sur les plates-formes suivantes : Facebook, Twitter, Wordpress, Flickr, Windows Live Photo, Picasa Web Albums, Smugmug.

C'est ici.

Ajouté le 2/12/2009 : la méthodologie suivie est décrite ici.

vendredi 27 novembre 2009

L’information embarquée dans l’image numérique

J'ai effectué le 25 novembre dernier une présentation intitulée L’information embarquée dans l’image numérique lors de la conférence "Quel avenir pour nos images numériques ?". Cette très brève introduction (18 diapositives) aux métadonnées Exif (et GPS), IPTC/IIM et XMP des images numériques est disponible :

La conférence était organisée à la Maison Européenne de la Photographie à l'occasion de la sortie du livre de Daniel Hennemand Gérer ses photos numériques - Trier - Archiver - Partager qui vient de paraître aux Éditions Eyrolles.

mercredi 11 février 2009

Commons photos on Flickr without User-generated content

Following are lists of Commons photos without any User-generated content (UGC), i.e. photos that have no comments, no new tags and no notes added by users.
Lists are displayed by institutions participating to The Commons.

Total photos checked: 18290 in 19 institutions
Total photos without UGC (no comments, no new tags, no notes): 5123

Summary

1. The Library of Congress, Washington, D.C., United States
5421 photos, 44 photos without UGC (0.008 %)

2. The Powerhouse Museum Collection, Sydney, Australia
1101 photos, 336 photos without UGC (0.3 %)

3. The Brooklyn Museum, New York, United States
2554 photos, 167 photos without UGC (0.07 %)

4. The Smithsonian Institution, Washington, D.C., United States
1414 photos, 327 photos without UGC (0.23 %)

5. Bibliothèque de Toulouse, France
652 photos, 378 photos without UGC (0.58 %)

6. The George Eastman House, Rochester, NY, United States
592 photos, 60 photos without UGC (0.10 %)

7. Biblioteca de Arte-Fundação Calouste Gulbenkian, Lisboa, Portugal
3073 photos, 2745 photos without UGC (0.89 %)

8. National Media Museum, Bradford, West Yorkshire, UK
130 photos, 16 photos without UGC (0.12 %)

9. National Maritime Museum, Greenwich, UK
191 photos, 48 photos without UGC (0.25 %)

10. State Library of New South Wales, Australia
250 photos, 1 photo without UGC (0.004 %)

11. The Library of Virginia, Richmond, Virginia, United States
314 photos, 93 photos without UGC (0.30 %)

12. Musée McCord Museum, Montréal, Canada
236 photos, 86 photos without UGC (0.36 %)

13. Nationaal Archief, The Hague, The Netherlands
590 photos, 141 photos without UGC (0.24 %)

14. Australian War Memorial, Canberra, Australia
42 photos, 1 photo without UGC (0.024 %)

15. Imperial War Museum, Londres, UK
10 photos, no photos without UGC (0 %)

16. National Library of New Zealand, Wellington, New Zealand
161 photos, 36 photos without UGC (0.22 %)

17. New York Public Library, New York, United States
1300 photos, 561 photos without UGC (0.43 %)

18. National Galleries of Scotland, Edinburgh, Scotland, UK
107 photos, 8 photos without UGC (0.074 %)

19. State Library of Queensland, Brisbane, Australia
152 photos, 83 photos without UGC (0.55 %)

Caution, it is a rather long post.
[Data collected on February 11, 2008]

Lire la suite...

dimanche 8 février 2009

The Commons sur Flickr, quelques chiffres

Le projet The Commons (“les Organismes publics” en français) a été lancé le 16 Janvier 2008 avec la publication sur Flickr de près de 3000 photographies de deux collections de la Library of Congress. Les objectifs de ce projet sont d'accroître l'accès aux collections détenues par des institutions du monde entier et de fournir au public un moyen lui permettant de contribuer à l'amélioration de la description de ces collections.
Pour en savoir plus: A Commons Bibliography sur le blog indicommons

Sur chaque photo, un utilisateur peut proposer:

Je donne ci-dessous quelques indications chiffrées sur le nombre de commentaires, tags, notes et machines tags pour chacune des institutions qui participent actuellement (chiffres collectés les 7 et 8 février 2009).
Quelques renseignements partiels sont aussi donnés sur le support des métadonnées IPTC et XMP dans chacune de ces collections.

(modifié le 21 février 2009 pour le Brooklyn Museum)

Lire la suite...

samedi 17 janvier 2009

Adobe ouvre la voie à de nouvelles applications pour la vidéo avec XMP Library for ActionScript

Adobe poursuit sa stratégie de développement XMP en direction de la vidéo et vient de publier le premier preview de XMP Library for ActionScript.

Le code est basé sur la bibliothèque XMPCore utilisée pour traiter et gérer les métadonnées XMP et permet de les lire dans les fichiers SWF, FLV et F4V (avec Flash Player 10 uniquement).

Les applications CS4 permettent de capturer un grand nombre de métadonnées dans le processus de production et de les rendre disponibles dans les fichiers FLV ou F4V. Ces fichiers vidéo enrichis d'informations peuvent donc désormais être exploités dans les applications Flex grâce à cette bibliothèque.

Puisque la fonction de transcription vocale automatique (Speech To Text) des logiciels Premiere Pro et Soundbooth permet de convertir les dialogues de séquences vidéo (ou audio) en métadonnées texte, il devient ainsi possible par exemple de lire les métadonnées stockées dans un fichier vidéo et de les afficher automatiquement en synchronisation avec la lecture de la vidéo, de rechercher des métadonnées dans un fichier Flash pour commencer la lecture à un mot précis d’un dialogue, etc.

Lorsque les données GPS sont capturées, il est aussi possible de créer un widget Flex affichant dynamiquement une carte figurant les endroits où la vidéo a été prise.

Pour reprendre les termes de Gunar Penikis, les métadonnées XMP doivent maintenant être fondamentalement pensées comme un autre moyen de communication (another communication channel) facilement accessible et connecté à d'autres ressources Web pour construire de nouvelles applications.

SourceXMP Library for ActionScript on Labs (From Gunar)

- page 1 de 3