Flickr et PhotosNormandie
Par Patrick Peccatte le mardi 10 mars 2009, 18:41 - documentation - Lien permanent
Voici l’article intitulé Flickr et PhotosNormandie: une entreprise collective de redocumentarisation paru dans la revue de l’ADBS Documentalistes Sciences de l’information à l’occasion du dossier autour du web 2.0 dans le numéro de Mars 2009.
Merci à l’ADBS de permettre la publication en intégralité de cet article.
Le projet PhotosNormandie a pour but d'améliorer
l'indexation d'un fonds de photos historiques sur la Bataille de Normandie,
présenté par le site Archives
Normandie 1939-1945 mis en place en 2004 par le Conseil Régional de
Basse-Normandie. Les 2763 photos qui y figurent proviennent des Archives
Nationales des États-Unis et du Canada, et sont libres de droits avec pour
seule contrainte l'obligation de mentionner leur origine lors de toute
utilisation.
Or de nombreuses légendes de photos comportent des erreurs importantes, ce
qui diminue grandement l'intérêt documentaire de cette collection accessible au
grand public. À la fin de l'année 2006, Michel Le Querrec – co-responsable du
projet – et moi-même avons donc décidé d'améliorer les descriptions de ces
photos. Il s'agit d'une initiative privée développée par une équipe de
passionnés désireux de mieux valoriser ce fonds tout en augmentant sa
visibilité.
Nous avons utilisé les fonctionnalités de la plate-forme de partage de
photos et vidéos Flickr.
Encapsulation
des données
Sur le plan technique, le projet repose sur l'utilisation d'informations
associées à une image et communément appelées métadonnées IPTC; il s'agit de champs textuels (Titre,
Description, Mots-clés, Ville, Pays, etc.) stockés à l'intérieur de l'image
numérique.
Lors du chargement sur Flickr d'une photo contenant des métadonnées IPTC,
celles-ci sont automatiquement décodées et utilisées pour renseigner les champs
affichés. Cette technique d'encapsulation des métadonnées permet à la
description textuelle de l'image d'être toujours disponible avec l'image et
facilement réutilisable; il n'y a pas de risque de perdre des métadonnées, et
l'utilisateur reste ainsi libre de la technologie utilisée pour l'exploitation
de son fonds. Le travail rédactionnel demeure contrôlé en local puisqu'il est
stocké dans les photos. Nous ne sommes pas captifs de la plate-forme de
partage.
Cependant, puisque chaque photo est identifiée sur Flickr par un numéro
automatiquement attribué, l'URL pointant sur une photo de notre projet ne peut
être considérée comme stable car le numéro en question change lors d'une mise à
jour. Il est cependant très facile de retrouver chaque photo grâce à son
identifiant unique hérité du site Archives Normandie 1939-1945.
Une prise en
main facile
Tout visiteur peut rechercher, afficher, télécharger les photos en haute
définition. Pour commenter les photos, l'utilisateur doit ouvrir un compte
gratuit sur Flickr et propose alors ses corrections dans le champ "Ajoutez votre
commentaire". Une discussion peut s'établir entre les divers
participants du projet et se termine par la validation éditoriale des
modifications proposées.
La prise en main de l'outil est très facile, y compris pour les
participants peu familiers avec les outils collaboratifs du Web. Le déploiement
requiert un budget extrêmement faible (un seul compte Pro Flickr à 24,95
dollars par an) et ne nécessite aucun coût de formation.
830 000
visites
Au total, nous avons complété, corrigé et mis à jour plus de 4200
descriptions. Ce nombre plus élevé que celui des photos s'explique parce que
certaines légendes ont été corrigées plusieurs fois.
La typologie des améliorations peut être résumée ainsi :
- identifications de localisation, de personnages, d'unités militaires ;
- précisions de dates ;
- précisions descriptives sur l'image ;
- références : renvois à des livres, à des sites ;
- identifications des photos censurées, des photos en couleur, des photos en doubles et des séries ;
- contextualisations historiques : précisions sur un mouvement d'unité, une action, etc. en rapport avec l'image ;
- contextualisations iconographiques à l'aide d'autres sources : séquences vidéos de la même scène ou autres photos.
Ainsi, entre janvier 2007 et décembre 2008, les 2763 photos du corpus ont
été vues globalement plus de 830 000 fois, ce qui correspond à plus de 1300
visites par jour. Le groupe Discussions sur PhotosNormandie compte 41 membres
dont une dizaine participe régulièrement au projet en postant des
commentaires.
Réseaux de
compétences
En effet, l'un des intérêts du projet est de faire appel à des
spécialistes aux compétences complémentaires. À côté des recherches et
références classiques dans des ouvrages et magazines, nous avons aussi
abondamment utilisé les recherches sur le Web et sollicité les habitués de
certains forums spécialisés. On peut donc distinguer, à côté de la production
directe, une seconde strate dans l’organisation du travail. Elle est constituée
par les contributions indirectes apportées par les utilisateurs des forums qui
forment une sorte de réseau de second niveau qu’il est indispensable d’activer
dans ce genre de projet. L’usage de Flickr a permis de contacter des
participants inconnus avant le démarrage du projet et constitue la source
principale des informations obtenues.
Nous avons pu également tester un nouveau service de recherche d’images
par similarité avec le logiciel TinEye de la
société Idée.
Une entreprise
collaborative de redocumentarisation
Flickr apparaît dans ce projet comme un outil intégré à d'autres usages du
web (forums et autres sources d'information, recherche de documents, recherche
par similarité, etc.) dans un processus de redocumentarisation, c'est-à-dire
dans une entreprise collective qui vise à traiter à nouveau une collection de
documents; il s'agit bien de réindexer un corpus iconographique grâce aux
possibilités ouvertes par les technologies numériques et Internet (pas
seulement le Web social).
Il existe d'autres projets similaires. Un an après le démarrage de
PhotosNormandie, la Library of Congress a mis en ligne sur
Flickr et en partenariat avec ce dernier plus de 3000 photos; c'est le projet
appelé The Commons, auquel participent
maintenant seize autres institutions.
L'activité régulière du projet PhotosNormandie durant presque deux années a
permis d'améliorer de façon substantielle la qualité des descriptions, et même
de les enrichir d'informations probablement inédites. Ce fonctionnement
efficace repose sur la simplicité et la souplesse de l'outil collaboratif
qu'est Flickr, sur la qualité des intervenants, mais aussi sur un travail
important de la part des co-responsables. Notre organisation a conduit à
définir deux fonctions indispensables :
- un rédacteur en chef capable de synthétiser les informations recueillies dans une discussion ou sur d'autres sources et de rédiger une description précise et cohérente. Ce n'est pas un animateur ou un coordinateur proposant de nouvelles descriptions au groupe de travail; il s'agit d'une fonction analogue à celle rencontrée dans la presse puisqu'il décide seul de son texte final à partir des éléments rédactionnels recueillis ;
- un administrateur technique qui malgré les automatismes mis en place doit effectuer un travail régulier.
L'expérience acquise au cours de ce projet est très positive et
certainement applicable à de nombreux domaines qui nécessitent la participation
de spécialistes disséminés dans le monde entier.
