Résumé : Depuis son introduction en 1993, le format PDF supporte un jeu très simple de métadonnées internes habituellement nommé Document Info. Il s'agit de six champs textuels libres qui décrivent le document et son moyen de production (Titre, Auteur, Sujet, Mots-clés, Producteur du PDF, Application) et deux champs de type date (Date de création, Date de modification). Adobe a ensuite défini XMP en 2001 et introduit cette dernière technologie progressivement dans tous les formats de fichiers gérés par ses applications. Les documents PDF supportent donc désormais deux types de métadonnées embarquées : le Document Info « historique » et les informations XMP beaucoup plus élaborées. Ce billet décrit trois caractéristiques permettant d'évaluer si un logiciel gère correctement ces métadonnées.
métadonnées
mardi 5 janvier 2010
Les métadonnées embarquées dans les documents PDF
Par Patrick Peccatte le mardi 5 janvier 2010, 10:58
lundi 30 novembre 2009
La (non) préservation des métadonnées des images sur les médias sociaux
Par Patrick Peccatte le lundi 30 novembre 2009, 08:40
Le groupe ControlledVocabulary publie un tableau utile qui récapitule comment les métadonnées Exif, IPTC et XMP sont (mal)traitées lors du chargement des images sur les plates-formes suivantes : Facebook, Twitter, Wordpress, Flickr, Windows Live Photo, Picasa Web Albums, Smugmug.
C'est ici.
Ajouté le 2/12/2009 : la méthodologie suivie est décrite ici.
vendredi 27 novembre 2009
L’information embarquée dans l’image numérique
Par Patrick Peccatte le vendredi 27 novembre 2009, 15:35
J'ai effectué le 25 novembre dernier une présentation intitulée L’information embarquée dans l’image numérique lors de la conférence "Quel avenir pour nos images numériques ?". Cette très brève introduction (18 diapositives) aux métadonnées Exif (et GPS), IPTC/IIM et XMP des images numériques est disponible :
- sur Slideshare
- sur Scribd
La conférence était organisée à la Maison Européenne de la Photographie à l'occasion de la sortie du livre de Daniel Hennemand Gérer ses photos numériques - Trier - Archiver - Partager qui vient de paraître aux Éditions Eyrolles.
mercredi 11 février 2009
Commons photos on Flickr without User-generated content
Par Patrick Peccatte le mercredi 11 février 2009, 14:45
Following are lists of Commons photos without any User-generated content
(UGC), i.e. photos that have no comments, no new tags and no notes added by
users.
Lists are displayed by institutions participating to The Commons.
Total photos checked: 18290 in 19 institutions
Total photos without UGC (no comments, no new tags, no notes): 5123
Summary
1. The Library of Congress, Washington, D.C., United States
5421 photos, 44 photos without UGC (0.008 %)
2. The Powerhouse Museum Collection, Sydney, Australia
1101 photos, 336 photos without UGC (0.3 %)
3. The Brooklyn Museum, New York, United States
2554 photos, 167 photos without UGC (0.07 %)
4. The Smithsonian Institution, Washington, D.C., United States
1414 photos, 327 photos without UGC (0.23 %)
5. Bibliothèque de Toulouse, France
652 photos, 378 photos without UGC (0.58 %)
6. The George Eastman House, Rochester, NY, United States
592 photos, 60 photos without UGC (0.10 %)
7. Biblioteca de Arte-Fundação Calouste Gulbenkian, Lisboa, Portugal
3073 photos, 2745 photos without UGC (0.89 %)
8. National Media Museum, Bradford, West Yorkshire, UK
130 photos, 16 photos without UGC (0.12 %)
9. National Maritime Museum, Greenwich, UK
191 photos, 48 photos without UGC (0.25 %)
10. State Library of New South Wales, Australia
250 photos, 1 photo without UGC (0.004 %)
11. The Library of Virginia, Richmond, Virginia, United States
314 photos, 93 photos without UGC (0.30 %)
12. Musée McCord Museum, Montréal, Canada
236 photos, 86 photos without UGC (0.36 %)
13. Nationaal Archief, The Hague, The Netherlands
590 photos, 141 photos without UGC (0.24 %)
14. Australian War Memorial, Canberra, Australia
42 photos, 1 photo without UGC (0.024 %)
15. Imperial War Museum, Londres, UK
10 photos, no photos without UGC (0 %)
16. National Library of New Zealand, Wellington, New Zealand
161 photos, 36 photos without UGC (0.22 %)
17. New York Public Library, New York, United States
1300 photos, 561 photos without UGC (0.43 %)
18. National Galleries of Scotland, Edinburgh, Scotland, UK
107 photos, 8 photos without UGC (0.074 %)
19. State Library of Queensland, Brisbane, Australia
152 photos, 83 photos without UGC (0.55 %)
[Data collected on February 11, 2008]
dimanche 8 février 2009
The Commons sur Flickr, quelques chiffres
Par Patrick Peccatte le dimanche 8 février 2009, 12:21
Le projet The Commons (“les
Organismes publics” en français) a été lancé le 16 Janvier 2008 avec la
publication sur Flickr de près de 3000 photographies de deux collections de la
Library of
Congress. Les objectifs de ce projet sont d'accroître l'accès aux
collections détenues par des institutions du monde entier et de fournir au
public un moyen lui permettant de contribuer à l'amélioration de la description
de ces collections.
Pour en savoir plus: A Commons
Bibliography sur le blog indicommons
Sur chaque photo, un utilisateur peut proposer:
- des commentaires
- des tags
- des notes associées à des zones de la photo
- des machines tags (voir mon billet Un nouveau projet documentaire basé sur Flickr: accessCeramics pour une explication des machine tags)
Je donne ci-dessous quelques indications chiffrées sur le nombre de
commentaires, tags, notes et machines tags pour chacune des institutions qui
participent actuellement (chiffres collectés les 7 et 8 février 2009).
Quelques renseignements partiels sont aussi donnés sur le support des
métadonnées IPTC et XMP dans chacune de ces collections.
(modifié le 21 février 2009 pour le Brooklyn Museum)
samedi 17 janvier 2009
Adobe ouvre la voie à de nouvelles applications pour la vidéo avec XMP Library for ActionScript
Par Patrick Peccatte le samedi 17 janvier 2009, 10:51
Le code est basé sur la bibliothèque XMPCore utilisée pour traiter et gérer les métadonnées XMP et permet de les lire dans les fichiers SWF, FLV et F4V (avec Flash Player 10 uniquement).
Les applications CS4 permettent de capturer un grand nombre de métadonnées dans le processus de production et de les rendre disponibles dans les fichiers FLV ou F4V. Ces fichiers vidéo enrichis d'informations peuvent donc désormais être exploités dans les applications Flex grâce à cette bibliothèque.
Puisque la fonction de transcription vocale automatique (Speech To Text) des logiciels Premiere Pro et Soundbooth permet de convertir les dialogues de séquences vidéo (ou audio) en métadonnées texte, il devient ainsi possible par exemple de lire les métadonnées stockées dans un fichier vidéo et de les afficher automatiquement en synchronisation avec la lecture de la vidéo, de rechercher des métadonnées dans un fichier Flash pour commencer la lecture à un mot précis d’un dialogue, etc.
Lorsque les données GPS sont capturées, il est aussi possible de créer un widget Flex affichant dynamiquement une carte figurant les endroits où la vidéo a été prise.
Pour reprendre les termes de Gunar Penikis, les métadonnées XMP doivent maintenant être fondamentalement pensées comme un autre moyen de communication (another communication channel) facilement accessible et connecté à d'autres ressources Web pour construire de nouvelles applications.
Source: XMP Library for ActionScript on Labs (From Gunar)
« billets précédents - page 1 de 3