Du bruit au signal (et inversement)

Aller au contenu | Aller au menu | Aller à la recherche

Tag - indexation sociale

Fil des billets - Fil des commentaires

dimanche 15 novembre 2009

Une typologie du crowdsourcing appliqué aux images

Plusieurs applications actives sur le web proposent un espace d'expression sur les images et sollicitent la participation des utilisateurs. L'écriture de tags non contrôlés et de commentaires libres sur des photos constitue l'activité de crowdsourcing la plus connue. Mais il en existe d'autres. Ce billet propose une typologie de ces initiatives collaboratives diverses. J'ai retenu ici 6 catégories caractéristiques : constitution de corpus, relevé d'erreurs dans les descriptions, identification visuelle, indexation libre, indexation contrôlée, redocumentarisation. La suite de ce billet explique et illustre chacune de ces catégories.

Cette typologie ne constitue qu'une proposition et elle est évidemment provisoire. D'autres critères sont également importants et doivent être pris en compte. On peut ainsi distinguer les projets ouverts à tous et les projets qui sont destinés uniquement à un public de professionnels, les initiatives institutionnelles et celles qui sont portées par un collectif indépendant, l'utilisation d'une plate-forme grand public ou d'un développement spécifique, l'usage ou non de technologies Web 2.0, le recours ou non aux standards de métadonnées, etc. Les projets qui illustrent cette typologie sont ceux qui me semblent les plus représentatifs. Si vous en connaissez d'autres, n'hésitez pas à m'en informer en laissant un commentaire.

Une dernière précision : j'ai retenu pour chaque projet sa caractéristique principale; il est donc mentionné dans une seule catégorie. Mais si l'on entre dans le détail des projets, certains pourraient appartenir à plusieurs catégories. Ainsi, lors de la constitution d'un corpus de photos, celles-ci sont la plupart du temps également taggées ou décrites succinctement.

Je remercie Nathalie Casemajor Loustau, Jean-Pierre Dalbéra, Anne Reydellet, Claire Scopsi, Yannick Vernet, le collectif du blog Indicommons pour leurs informations.

Lire la suite...

lundi 2 novembre 2009

Contenu généré par les utilisateurs : quelle légitimité ?

Un bref billet paru dans la revue Archimag n° 227, septembre 2009 :

« La question de la légitimité et de la validité des contenus générés par les utilisateurs est bien connue dans les cas de Wikipédia et du journalisme citoyen, mais ne se pose pas dans les mêmes termes lorsque le crowdsourcing est d’envergure bien moindre, le sujet spécialisé et les méthodes différentes. PhotosNormandie est un projet collaboratif actif depuis janvier 2007. Il a pour but d’améliorer la description documentaire de photos historiques sur la bataille de Normandie en utilisant les possibilités de Flickr. Les participants réguliers connaissent tous fort bien le sujet et possèdent de nombreux ouvrages et revues de référence. Ils ont aussi une bonne connaissance locale et familiale de ces événements. Ce sont des amateurs passionnés qui ont développé des compétences pointues. Ce noyau de participants fonctionne comme un comité éditorial informel qui valide les informations proposées. Les critères sont simples. Si une information provient d’une source publiée, on doit la citer. Dans le cas contraire, il est nécessaire de produire des éléments visuels – observation de la photo, autres photos similaires, films, plans, cartes – ou bien d’autres arguments qui proviennent de témoignages directs ou indirects. Enfin, les informations plausibles doivent être explicitement mentionnées comme des hypothèses. 

Le travail collectif effectué tient sa légitimité de la qualité et de la vérifiabilité des résultats obtenus. Il est très facile du reste de comparer les légendes produites avec celles qui figurent sur le site d’origine, qui renferme de nombreuses erreurs. Ce projet, comme tout travail de redocumentarisation, est un work in progress. Il est conduit par des amateurs compétents, organisés collectivement, et qui sont plus soucieux de produire des contenus de qualité que de gloser indéfiniment sur leur légitimité. Les légendes de PhotosNormandie sont d’ailleurs reprises dans certains ouvrages spécialisés. »

Voir aussi le billet plus développé Sur la légitimité des contenus générés par les utilisateurs.

dimanche 11 octobre 2009

L'histoire contemporaine à l'ère digitale - Luxembourg, 15 et 16 octobre 2009

L’Université du Luxembourg (Master en Histoire européenne contemporaine) et le Centre Virtuel de la Connaissance sur l’Europe (CVCE) organisent un Symposium les 15 et 16 octobre 2009 sur le thème L’histoire contemporaine à l’ère digitale.

Je présenterai lors de cette réunion une communication intitulée :

Une plate-forme collaborative pour la redocumentarisation d’un fonds photographique historique.

Programme complet et renseignements sur Calenda.

mardi 30 juin 2009

Sur la légitimité des contenus générés par les utilisateurs

[Première version le 30 juin 2009, dernière modification le 2 juillet 2009]

Le Web 2.0 est contributif. Les contenus générés par les utilisateurs constituent l'une de ses caractéristiques fondamentales. Dès leur apparition, on s'est interrogé sur la légitimité et la validité de ces contenus issus du crowdsourcing ainsi que sur l'absence d'autorités de référence lors de leur production. Ces interrogations qui prennent souvent la forme de critiques sont bien connues dans le cas des entreprises emblématiques comme Wikipedia - comparé aux encyclopédies classiques - ou encore pour le journalisme citoyen tel qu'il s'exprime notamment à travers les blogs politiques et d'actualités ou les services de micro-blogging comme Twitter. Ces questions méritent également d'être abordées en ce qui concerne des projets collaboratifs d'envergure et d'audience bien moindres mais dont les méthodes et les enjeux sont d'une toute autre nature. Ce billet décrit en détail le processus de validation qui s'est naturellement mis en place dans le cadre du projet PhotosNormandie et examine en conséquence la question de la légitimité des contenus générés par les utilisateurs dans ce travail.

Lire la suite...

samedi 27 juin 2009

Les limites du crowdsourcing [signalement]

Larry Cebula, professeur d'histoire à l'Eastern Washington University, vient de publier un intéressant billet sur son blog :

"Lick This": LOC, Flickr, and the Limits of Crowd Sourcing

Il constate qu'une grande partie des contenus générés par les utilisateurs (notes, commentaires, tags, envois dans un groupe) sur une photographie proposée par la Library of Congress dans le cadre du projet The Commons sont sans intérêt. La plupart des notes par exemple sont anodines ou constituent des plaisanteries ; aucune n'apporte d'information historique. Le "bruit" est également très présent dans les commentaires et les tags ajoutés. Au final, Larry regrette que les rares informations valables générées par les utilisateurs soient noyées dans une masse de textes inintéressants et que l'extraction de ces pépites demande beaucoup de temps.

Dans la discussion à propos de ce billet, j'ai suggéré que ce phénomène est probablement lié à la popularité de la Library of Congress ; sur notre projet PhotosNormandie en tout cas, nous n'observons pas du tout ce genre de comportement de la part des utilisateurs et presque tous les commentaires proposés présentent un intérêt direct ou indirect avec les photos commentées.

Le billet est relayé sur le groupe Flickr Commons où la discussion qu'il provoque est très intéressante.

vendredi 12 juin 2009

7ème colloque du chapitre français de l’ISKO - Intelligence collective et organisation des connaissances

L’ISKO (International Society for Knowledge Organization) est une société savante internationale créée en 1989, à but non lucratif, destinée à favoriser la recherche et les échanges entre les chercheurs et les spécialistes du domaine de l'organisation des connaissances.
L'ISKO réunit environ 600 spécialistes de 54 pays qui travaillent sur les problèmes de l’organisation de l’information selon des approches complémentaires issues en particulier des sciences de l'information, de la linguistique, de l'informatique et des sciences cognitives.

Le 7ème colloque du chapitre français de l’ISKO, intitulé Intelligence collective et organisation des connaissances, se tiendra à Lyon les 24, 25 et 26 juin 2009. Il est organisé par l’Université Jean Moulin Lyon 3 et l'ENSSIB.
Le programme complet est disponible ici.

J'interviendrai le jeudi 25 juin après-midi sur la redocumentarisation iconographie dans l'Atelier 3 Image, travail collaboratif et réseaux sociaux animé par Gérard Régimbeau et Christophe Catanese.

- page 1 de 5