Du bruit au signal (et inversement)

Aller au contenu | Aller au menu | Aller à la recherche

samedi 27 juin 2009

Les limites du crowdsourcing [signalement]

Larry Cebula, professeur d'histoire à l'Eastern Washington University, vient de publier un intéressant billet sur son blog :

"Lick This": LOC, Flickr, and the Limits of Crowd Sourcing

Il constate qu'une grande partie des contenus générés par les utilisateurs (notes, commentaires, tags, envois dans un groupe) sur une photographie proposée par la Library of Congress dans le cadre du projet The Commons sont sans intérêt. La plupart des notes par exemple sont anodines ou constituent des plaisanteries ; aucune n'apporte d'information historique. Le "bruit" est également très présent dans les commentaires et les tags ajoutés. Au final, Larry regrette que les rares informations valables générées par les utilisateurs soient noyées dans une masse de textes inintéressants et que l'extraction de ces pépites demande beaucoup de temps.

Dans la discussion à propos de ce billet, j'ai suggéré que ce phénomène est probablement lié à la popularité de la Library of Congress ; sur notre projet PhotosNormandie en tout cas, nous n'observons pas du tout ce genre de comportement de la part des utilisateurs et presque tous les commentaires proposés présentent un intérêt direct ou indirect avec les photos commentées.

Le billet est relayé sur le groupe Flickr Commons où la discussion qu'il provoque est très intéressante.

samedi 9 mai 2009

Un million de visites sur PhotosNormandie

La galerie PhotosNormandie sur Flickr a été vue à ce jour un million de fois, ce qui correspond à plus de 1200 visites quotidiennes depuis le démarrage du projet le 29 janvier 2007.
Les 2763 photos de ce corpus en cours de redocumentarisation ont été vues plus de 2 600 000 fois.
Nous avons complété et corrigé au total 4486 descriptions. Ce nombre plus élevé que celui des photos s'explique parce que certaines légendes ont été corrigées plusieurs fois.

Un grand merci à Michel Le Querrec, co-responsable du projet, à tous les contributeurs passionnés et inlassables qui ont assuré son succès, aux amis et visiteurs qui nous ont manifesté leur intérêt tout au long de cette entreprise qui se poursuit toujours.
À paraître
  • Une interview pour le livre
    A Different Kind of Web: New Connections Between Archives and Our Users with Web 2.0, Edited by Kate Theimer, the Society of American Archivists
    Il s'agit d'un ensemble d'essais qui explorent la manière dont le Web 2.0 modifie les relations des services d'archives avec leurs utilisateurs. L'ouvrage comportera différentes études de cas sur les expériences menées par The Library of Congress, The National Archives (UK), The New York State Historical Association, plusieurs universités américaines, et ... PhotosNormandie.
Pour en savoir plus
PS : j'en profite pour signaler un beta test en cours sur Fotonauts et une nouvelle version du billet Variations sur un symbole américain

mardi 10 mars 2009

Flickr et PhotosNormandie

 

Voici l’article intitulé Flickr et PhotosNormandie: une entreprise collective de redocumentarisation paru dans la revue de l’ADBS Documentalistes Sciences de l’information à l’occasion du dossier autour du web 2.0 dans le numéro de Mars 2009.

Merci à l’ADBS de permettre la publication en intégralité de cet article.

Lire la suite...

mercredi 11 février 2009

Commons photos on Flickr without User-generated content

Following are lists of Commons photos without any User-generated content (UGC), i.e. photos that have no comments, no new tags and no notes added by users.
Lists are displayed by institutions participating to The Commons.

Total photos checked: 18290 in 19 institutions
Total photos without UGC (no comments, no new tags, no notes): 5123

Summary

1. The Library of Congress, Washington, D.C., United States
5421 photos, 44 photos without UGC (0.008 %)

2. The Powerhouse Museum Collection, Sydney, Australia
1101 photos, 336 photos without UGC (0.3 %)

3. The Brooklyn Museum, New York, United States
2554 photos, 167 photos without UGC (0.07 %)

4. The Smithsonian Institution, Washington, D.C., United States
1414 photos, 327 photos without UGC (0.23 %)

5. Bibliothèque de Toulouse, France
652 photos, 378 photos without UGC (0.58 %)

6. The George Eastman House, Rochester, NY, United States
592 photos, 60 photos without UGC (0.10 %)

7. Biblioteca de Arte-Fundação Calouste Gulbenkian, Lisboa, Portugal
3073 photos, 2745 photos without UGC (0.89 %)

8. National Media Museum, Bradford, West Yorkshire, UK
130 photos, 16 photos without UGC (0.12 %)

9. National Maritime Museum, Greenwich, UK
191 photos, 48 photos without UGC (0.25 %)

10. State Library of New South Wales, Australia
250 photos, 1 photo without UGC (0.004 %)

11. The Library of Virginia, Richmond, Virginia, United States
314 photos, 93 photos without UGC (0.30 %)

12. Musée McCord Museum, Montréal, Canada
236 photos, 86 photos without UGC (0.36 %)

13. Nationaal Archief, The Hague, The Netherlands
590 photos, 141 photos without UGC (0.24 %)

14. Australian War Memorial, Canberra, Australia
42 photos, 1 photo without UGC (0.024 %)

15. Imperial War Museum, Londres, UK
10 photos, no photos without UGC (0 %)

16. National Library of New Zealand, Wellington, New Zealand
161 photos, 36 photos without UGC (0.22 %)

17. New York Public Library, New York, United States
1300 photos, 561 photos without UGC (0.43 %)

18. National Galleries of Scotland, Edinburgh, Scotland, UK
107 photos, 8 photos without UGC (0.074 %)

19. State Library of Queensland, Brisbane, Australia
152 photos, 83 photos without UGC (0.55 %)

Caution, it is a rather long post.
[Data collected on February 11, 2008]

Lire la suite...

dimanche 8 février 2009

The Commons sur Flickr, quelques chiffres

Le projet The Commons (“les Organismes publics” en français) a été lancé le 16 Janvier 2008 avec la publication sur Flickr de près de 3000 photographies de deux collections de la Library of Congress. Les objectifs de ce projet sont d'accroître l'accès aux collections détenues par des institutions du monde entier et de fournir au public un moyen lui permettant de contribuer à l'amélioration de la description de ces collections.
Pour en savoir plus: A Commons Bibliography sur le blog indicommons

Sur chaque photo, un utilisateur peut proposer:

Je donne ci-dessous quelques indications chiffrées sur le nombre de commentaires, tags, notes et machines tags pour chacune des institutions qui participent actuellement (chiffres collectés les 7 et 8 février 2009).
Quelques renseignements partiels sont aussi donnés sur le support des métadonnées IPTC et XMP dans chacune de ces collections.

(modifié le 21 février 2009 pour le Brooklyn Museum)

Lire la suite...

dimanche 21 décembre 2008

Un nouveau projet documentaire basé sur Flickr: accessCeramics

Après PhotosNormandie (janvier 2007) et l'initiative de la Library of Congress (janvier 2008) rejointe par plusieurs autres institutions publiques (The Commons), accessCeramics est un nouveau projet documentaire iconographique basé sur Flickr.

Lire la suite...

- page 2 de 4 -