Du bruit au signal (et inversement)

Aller au contenu | Aller au menu | Aller à la recherche

lundi 30 novembre 2009

La (non) préservation des métadonnées des images sur les médias sociaux

Le groupe ControlledVocabulary publie un tableau utile qui récapitule comment les métadonnées Exif, IPTC et XMP sont (mal)traitées lors du chargement des images sur les plates-formes suivantes : Facebook, Twitter, Wordpress, Flickr, Windows Live Photo, Picasa Web Albums, Smugmug.

C'est ici.

Ajouté le 2/12/2009 : la méthodologie suivie est décrite ici.

vendredi 27 novembre 2009

L’information embarquée dans l’image numérique

J'ai effectué le 25 novembre dernier une présentation intitulée L’information embarquée dans l’image numérique lors de la conférence "Quel avenir pour nos images numériques ?". Cette très brève introduction (18 diapositives) aux métadonnées Exif (et GPS), IPTC/IIM et XMP des images numériques est disponible :

La conférence était organisée à la Maison Européenne de la Photographie à l'occasion de la sortie du livre de Daniel Hennemand Gérer ses photos numériques - Trier - Archiver - Partager qui vient de paraître aux Éditions Eyrolles.

mardi 26 mai 2009

Traiter (des photos) pour trouver [signalement]

Dans son blog Descripteurs, Sylvie Dalbin revient sur mon billet récent concernant l'indexation des photos en mettant l'accent sur "les difficultés à articuler méthodes et outillages techno-documentaires "manuels" et automatiques".

À lire ici.

samedi 9 mai 2009

Un million de visites sur PhotosNormandie

La galerie PhotosNormandie sur Flickr a été vue à ce jour un million de fois, ce qui correspond à plus de 1200 visites quotidiennes depuis le démarrage du projet le 29 janvier 2007.
Les 2763 photos de ce corpus en cours de redocumentarisation ont été vues plus de 2 600 000 fois.
Nous avons complété et corrigé au total 4486 descriptions. Ce nombre plus élevé que celui des photos s'explique parce que certaines légendes ont été corrigées plusieurs fois.

Un grand merci à Michel Le Querrec, co-responsable du projet, à tous les contributeurs passionnés et inlassables qui ont assuré son succès, aux amis et visiteurs qui nous ont manifesté leur intérêt tout au long de cette entreprise qui se poursuit toujours.
À paraître
  • Une interview pour le livre
    A Different Kind of Web: New Connections Between Archives and Our Users with Web 2.0, Edited by Kate Theimer, the Society of American Archivists
    Il s'agit d'un ensemble d'essais qui explorent la manière dont le Web 2.0 modifie les relations des services d'archives avec leurs utilisateurs. L'ouvrage comportera différentes études de cas sur les expériences menées par The Library of Congress, The National Archives (UK), The New York State Historical Association, plusieurs universités américaines, et ... PhotosNormandie.
Pour en savoir plus
PS : j'en profite pour signaler un beta test en cours sur Fotonauts et une nouvelle version du billet Variations sur un symbole américain

mardi 28 avril 2009

Quelques remarques sur l'indexation des photos

Les agences photos utilisent des techniques diverses pour permettre la recherche de leurs images. Quelques-unes se servent de thésaurus ou de vocabulaires contrôlés pour l'indexation, certaines possèdent des plans de classement hiérarchisés, d'autres encore qualifient les mots-clés avec des "types" ou mettent en œuvre des classements à facettes, la plupart, enfin, n'utilisent pas de techniques documentaires particulières. Au final, en sortie de ce processus de description et de classement, elles utilisent pratiquement toutes depuis de nombreuses années le standard IPTC/IIM dans leurs flux d'images légendées. Mais l'adoption de ce standard conduit parfois à des résultats surprenants lors de l'encapsulation des informations dans l'image. Une indexation efficace en interne, sur le système utilisé par l'agence, semble ensuite d'une qualité documentaire médiocre quand on observe la photo légendée en IPTC. Notre propos ici est d'analyser une partie des informations contenues dans les images diffusées par les agences professionnelles (les mots-clés en l'occurrence) sans référence aux techniques spécifiques que celles-ci utilisent en amont pour produire ces informations. Il s'agit d'examiner les métadonnées des images indépendamment des opérations documentaires et informatiques qui les génèrent. C'est en effet ce résultat d'un processus souvent complexe qui est utilisé dans la diffusion des images sur les portails et les offres packagées. La recherche sur ces flux d'images de plus en plus utilisés s'effectue alors sur des métadonnées que l'on peut considérer bien souvent comme une présentation simplifiée, voire édulcorée dans certains cas, du travail d'indexation effectué en agence. Ces outils importent en effet les données IPTC et - contrairement aux bases documentaires des agences - effectuent une recherche full text sur la plupart ou sur la totalité des données en question. Les informations qui apparaissent alors ne sont plus liées aux outils documentaires, elles ne bénéficient donc plus des dictionnaires de synonymes, des plans de classement et autres thésaurus. L'utilisation de métadonnées déconnectées des outils qui ont servi à les générer pose un certain nombre de questions que nous examinons ici.

Lire la suite...

mardi 10 mars 2009

Flickr et PhotosNormandie

 

Voici l’article intitulé Flickr et PhotosNormandie: une entreprise collective de redocumentarisation paru dans la revue de l’ADBS Documentalistes Sciences de l’information à l’occasion du dossier autour du web 2.0 dans le numéro de Mars 2009.

Merci à l’ADBS de permettre la publication en intégralité de cet article.

Lire la suite...

- page 1 de 5