Le projet PhotosNormandie a pour but d'améliorer l'indexation d'un fonds de photos historiques sur la Bataille de Normandie, présenté par le site Archives Normandie 1939-1945 mis en place en 2004 par le Conseil Régional de Basse-Normandie. Les 2763 photos qui y figurent proviennent des Archives Nationales des États-Unis et du Canada, et sont libres de droits avec pour seule contrainte l'obligation de mentionner leur origine lors de toute utilisation.
Or de nombreuses légendes de photos comportent des erreurs importantes, ce qui diminue grandement l'intérêt documentaire de cette collection accessible au grand public. À la fin de l'année 2006, Michel Le Querrec – co-responsable du projet – et moi-même avons donc décidé d'améliorer les descriptions de ces photos. Il s'agit d'une initiative privée développée par une équipe de passionnés désireux de mieux valoriser ce fonds tout en augmentant sa visibilité.
Nous avons utilisé les fonctionnalités de la plate-forme de partage de photos et vidéos Flickr.

Encapsulation des données
Sur le plan technique, le projet repose sur l'utilisation d'informations associées à une image et communément appelées métadonnées IPTC; il s'agit de champs textuels (Titre, Description, Mots-clés, Ville, Pays, etc.) stockés à l'intérieur de l'image numérique.
Lors du chargement sur Flickr d'une photo contenant des métadonnées IPTC, celles-ci sont automatiquement décodées et utilisées pour renseigner les champs affichés. Cette technique d'encapsulation des métadonnées permet à la description textuelle de l'image d'être toujours disponible avec l'image et facilement réutilisable; il n'y a pas de risque de perdre des métadonnées, et l'utilisateur reste ainsi libre de la technologie utilisée pour l'exploitation de son fonds. Le travail rédactionnel demeure contrôlé en local puisqu'il est stocké dans les photos. Nous ne sommes pas captifs de la plate-forme de partage.
Cependant, puisque chaque photo est identifiée sur Flickr par un numéro automatiquement attribué, l'URL pointant sur une photo de notre projet ne peut être considérée comme stable car le numéro en question change lors d'une mise à jour. Il est cependant très facile de retrouver chaque photo grâce à son identifiant unique hérité du site Archives Normandie 1939-1945.

Une prise en main facile
Tout visiteur peut rechercher, afficher, télécharger les photos en haute définition. Pour commenter les photos, l'utilisateur doit ouvrir un compte gratuit sur Flickr et propose alors ses corrections dans le champ "Ajoutez votre commentaire". Une discussion peut s'établir entre les divers participants du projet et se termine par la validation éditoriale des modifications proposées.
La prise en main de l'outil est très facile, y compris pour les participants peu familiers avec les outils collaboratifs du Web. Le déploiement requiert un budget extrêmement faible (un seul compte Pro Flickr à 24,95 dollars par an) et ne nécessite aucun coût de formation.

830 000 visites
Au total, nous avons complété, corrigé et mis à jour plus de 4200 descriptions. Ce nombre plus élevé que celui des photos s'explique parce que certaines légendes ont été corrigées plusieurs fois.
La typologie des améliorations peut être résumée ainsi :
  • identifications de localisation, de personnages, d'unités militaires ;
  • précisions de dates ;
  • précisions descriptives sur l'image ;
  • références : renvois à des livres, à des sites ;
  • identifications des photos censurées, des photos en couleur, des photos en doubles et des séries ;
  • contextualisations historiques : précisions sur un mouvement d'unité, une action, etc. en rapport avec l'image ;
  • contextualisations iconographiques à l'aide d'autres sources : séquences vidéos de la même scène ou autres photos.
Ainsi, entre janvier 2007 et décembre 2008, les 2763 photos du corpus ont été vues globalement plus de 830 000 fois, ce qui correspond à plus de 1300 visites par jour. Le groupe Discussions sur PhotosNormandie compte 41 membres dont une dizaine participe régulièrement au projet en postant des commentaires.

Réseaux de compétences
En effet, l'un des intérêts du projet est de faire appel à des spécialistes aux compétences complémentaires. À côté des recherches et références classiques dans des ouvrages et magazines, nous avons aussi abondamment utilisé les recherches sur le Web et sollicité les habitués de certains forums spécialisés. On peut donc distinguer, à côté de la production directe, une seconde strate dans l’organisation du travail. Elle est constituée par les contributions indirectes apportées par les utilisateurs des forums qui forment une sorte de réseau de second niveau qu’il est indispensable d’activer dans ce genre de projet. L’usage de Flickr a permis de contacter des participants inconnus avant le démarrage du projet et constitue la source principale des informations obtenues.
Nous avons pu également tester un nouveau service de recherche d’images par similarité avec le logiciel TinEye de la société Idée.

Une entreprise collaborative de redocumentarisation
Flickr apparaît dans ce projet comme un outil intégré à d'autres usages du web (forums et autres sources d'information, recherche de documents, recherche par similarité, etc.) dans un processus de redocumentarisation, c'est-à-dire dans une entreprise collective qui vise à traiter à nouveau une collection de documents; il s'agit bien de réindexer un corpus iconographique grâce aux possibilités ouvertes par les technologies numériques et Internet (pas seulement le Web social).
Il existe d'autres projets similaires. Un an après le démarrage de PhotosNormandie, la Library of Congress a mis en ligne sur Flickr et en partenariat avec ce dernier plus de 3000 photos; c'est le projet appelé The Commons, auquel participent maintenant seize autres institutions.
L'activité régulière du projet PhotosNormandie durant presque deux années a permis d'améliorer de façon substantielle la qualité des descriptions, et même de les enrichir d'informations probablement inédites. Ce fonctionnement efficace repose sur la simplicité et la souplesse de l'outil collaboratif qu'est Flickr, sur la qualité des intervenants, mais aussi sur un travail important de la part des co-responsables. Notre organisation a conduit à définir deux fonctions indispensables :
  • un rédacteur en chef capable de synthétiser les informations recueillies dans une discussion ou sur d'autres sources et de rédiger une description précise et cohérente. Ce n'est pas un animateur ou un coordinateur proposant de nouvelles descriptions au groupe de travail; il s'agit d'une fonction analogue à celle rencontrée dans la presse puisqu'il décide seul de son texte final à partir des éléments rédactionnels recueillis ;
  • un administrateur technique qui malgré les automatismes mis en place doit effectuer un travail régulier.
L'expérience acquise au cours de ce projet est très positive et certainement applicable à de nombreux domaines qui nécessitent la participation de spécialistes disséminés dans le monde entier.