Du bruit au signal (et inversement)

Aller au contenu | Aller au menu | Aller à la recherche

lundi 18 janvier 2010

Heuristique et sérendipité : un exemple en images

Résumé

L'application de règles heuristiques explicites permet tout à la fois d'optimiser la recherche d'informations sur Internet et de favoriser la sérendipité. Un exemple de recherche documentaire concernant des images historiques illustre ce point de vue.

Lire la suite...

mardi 12 janvier 2010

PhotosNormandie, 3 ans et 5 millions de visites !

Le projet PhotosNormandie boucle sa troisième année d'activité le 29 janvier prochain et franchit aujourd'hui le cap des 5 millions de visites.

Je remercie tous les participants qui nous ont communiqué des informations, des références, des pistes de recherche intéressantes - en particulier le « noyau dur » du projet : Michel Le Querrec, bien sûr, qui réalise un exceptionnel travail de collecte, synthèse et rédaction, ainsi que Claude, BS, François, et quelques autres passionnés. Le fait que les participants à PhotosNormandie ne se connaissent pas "in the real life", situation que je jugeais assez anecdotique il y a 3 ans, m'apparait désormais comme l'un des attraits essentiels de l'expérience : constituer sur Internet un véritable groupe de recherche ouvert dont la méthodologie et les résultats sont facilement vérifiables.

Merci aussi aux archivistes, documentalistes, historiens, bibliothécaires, visualistes, iconographes, photographes, qui se sont intéressés à ce projet, m'ont invité dans différents colloques ou séminaires pour en discuter et ont permis que je m'exprime dans leurs revues. Nouer des liens avec tous ces professionnels, sur des sujets très divers et souvent passionnants, constitue l'une des grandes satisfactions apportées par ce projet.

Je remercie enfin les musées, bibliothèques ou archives de divers échelons, établissements publics, associations, agences photographiques, médias, en bref les détenteurs français de documents ou d'images en relation avec notre sujet. L'attitude constante depuis trois années de ces institutions et organismes vis-à-vis d'Internet nous a paradoxalement stimulé.

Certains en effet sont totalement absents du Web, pour d'autres le rare matériel proposé en ligne est de médiocre qualité, pour la plupart les descriptions associées aux images sont très approximatives, la maintenance et le suivi des sites événementiels ne sont pas assurés, leurs fonds les plus intéressants sont consultables uniquement sur place et réservés aux chercheurs, le plus souvent il est interdit de réaliser des captures d'écrans, on facture au prix fort une numérisation en stipulant des conditions d'usage strictes et en évitant soigneusement de mettre à disposition le document digital sur Internet, la simple copie d'un fichier sur une clé USB est payante, personne ne répond aux mails, et bien sûr quand on parle « patrimoine » et « bien public » on vous répond « copyright » et « ventes ».

Sans cette politique de détention des documents, sans la désinvolture, la méfiance et la frilosité de ces établissements envers les possibilités ouvertes par Internet, nous n'aurions peut-être pas sollicité aussi fréquemment et avec un tel succès les connaissances encyclopédiques et les impressionnantes documentations accumulées par de nombreux passionnés, labouré encore et encore les recoins d'Internet pour dénicher de multiples références, images ou informations, bâti et détruit des hypothèses, laissé en friche des sujets ouverts pour les reprendre des mois plus tard. Enfin et surtout, nous n'aurions peut-être pas eu autant de plaisir à partager nos petites découvertes. Quand Google s'intéressera vraiment à la diffusion des collections amassées par ces échoppes et que celles-ci seront alors réduites à l'état de conserveries, nous les regretterons. Un tout petit peu.

Statistiques du compte Flickr PhotosNormandie le 12 janvier 2010

jeudi 17 décembre 2009

Revoir Capa

Résumé : Plusieurs collections de photos sur la Seconde Guerre Mondiale sont accessibles sur le Web. Elles permettent de comparer des images parfois mal décrites avec celles réalisées par Robert Capa. Ce travail de mise en relation est un exemple de redocumentarisation sur Internet de certains fonds iconographiques. Dans le cas illustré ici, il conduit à proposer deux identifications : une photo où figure le célèbre photographe et une autre probablement prise par lui.

Attention : Nouvelle version de ce billet sur Culture Visuelle (24 avril 2010) 

Lire la suite...

dimanche 15 novembre 2009

Une typologie du crowdsourcing appliqué aux images

Plusieurs applications actives sur le web proposent un espace d'expression sur les images et sollicitent la participation des utilisateurs. L'écriture de tags non contrôlés et de commentaires libres sur des photos constitue l'activité de crowdsourcing la plus connue. Mais il en existe d'autres. Ce billet propose une typologie de ces initiatives collaboratives diverses. J'ai retenu ici 6 catégories caractéristiques : constitution de corpus, relevé d'erreurs dans les descriptions, identification visuelle, indexation libre, indexation contrôlée, redocumentarisation. La suite de ce billet explique et illustre chacune de ces catégories.

Cette typologie ne constitue qu'une proposition et elle est évidemment provisoire. D'autres critères sont également importants et doivent être pris en compte. On peut ainsi distinguer les projets ouverts à tous et les projets qui sont destinés uniquement à un public de professionnels, les initiatives institutionnelles et celles qui sont portées par un collectif indépendant, l'utilisation d'une plate-forme grand public ou d'un développement spécifique, l'usage ou non de technologies Web 2.0, le recours ou non aux standards de métadonnées, etc. Les projets qui illustrent cette typologie sont ceux qui me semblent les plus représentatifs. Si vous en connaissez d'autres, n'hésitez pas à m'en informer en laissant un commentaire.

Une dernière précision : j'ai retenu pour chaque projet sa caractéristique principale; il est donc mentionné dans une seule catégorie. Mais si l'on entre dans le détail des projets, certains pourraient appartenir à plusieurs catégories. Ainsi, lors de la constitution d'un corpus de photos, celles-ci sont la plupart du temps également taggées ou décrites succinctement.

Je remercie Nathalie Casemajor Loustau, Jean-Pierre Dalbéra, Anne Reydellet, Claire Scopsi, Yannick Vernet, le collectif du blog Indicommons pour leurs informations.

Lire la suite...

lundi 2 novembre 2009

Contenu généré par les utilisateurs : quelle légitimité ?

Un bref billet paru dans la revue Archimag n° 227, septembre 2009 :

« La question de la légitimité et de la validité des contenus générés par les utilisateurs est bien connue dans les cas de Wikipédia et du journalisme citoyen, mais ne se pose pas dans les mêmes termes lorsque le crowdsourcing est d’envergure bien moindre, le sujet spécialisé et les méthodes différentes. PhotosNormandie est un projet collaboratif actif depuis janvier 2007. Il a pour but d’améliorer la description documentaire de photos historiques sur la bataille de Normandie en utilisant les possibilités de Flickr. Les participants réguliers connaissent tous fort bien le sujet et possèdent de nombreux ouvrages et revues de référence. Ils ont aussi une bonne connaissance locale et familiale de ces événements. Ce sont des amateurs passionnés qui ont développé des compétences pointues. Ce noyau de participants fonctionne comme un comité éditorial informel qui valide les informations proposées. Les critères sont simples. Si une information provient d’une source publiée, on doit la citer. Dans le cas contraire, il est nécessaire de produire des éléments visuels – observation de la photo, autres photos similaires, films, plans, cartes – ou bien d’autres arguments qui proviennent de témoignages directs ou indirects. Enfin, les informations plausibles doivent être explicitement mentionnées comme des hypothèses. 

Le travail collectif effectué tient sa légitimité de la qualité et de la vérifiabilité des résultats obtenus. Il est très facile du reste de comparer les légendes produites avec celles qui figurent sur le site d’origine, qui renferme de nombreuses erreurs. Ce projet, comme tout travail de redocumentarisation, est un work in progress. Il est conduit par des amateurs compétents, organisés collectivement, et qui sont plus soucieux de produire des contenus de qualité que de gloser indéfiniment sur leur légitimité. Les légendes de PhotosNormandie sont d’ailleurs reprises dans certains ouvrages spécialisés. »

Voir aussi le billet plus développé Sur la légitimité des contenus générés par les utilisateurs.

mercredi 28 octobre 2009

Conférences à l'INTD le 6 novembre 2009

Conférences à l'INTD (Institut National des Techniques de la Documentation), vendredi 6 novembre 2009 :

  • 9h30-10h55  Valérie Gouet-Brunet  (CNAM Paris) - L'indexation de collections d'images par analyse de leur contenu visuel
  • 11h05-12h30  Patrick Peccatte  (Soft Experience) - Actualité du traitement de l’image : la redocumentarisation des fonds d’images

INTD-CNAM, Paris, 292 rue Saint Martin (75003), M° Arts et Métiers.
Accès 11, escalier A, étage 3, salle 33

Les personnes désireuses d'assister à ces interventions et qui ne sont pas étudiant(e)s à l'INTD peuvent envoyer un mail à claire.scopsi (at) cnam.fr

- page 1 de 4