Comme il a été mentionné dans un précédant billet, je vais aborder ici quelques études et articles afférents aux questions de fiabilité de Wikipédia.

L’étude d’IBM

Réalisée en 2003, l’étude d’IBM, dont seul le rapport préliminaire a été diffusé pour le moment, a consisté d’abord à élaborer des « History flow » offrant une meilleure visualisation des interactions multiagents dans le travail d’écriture collective de Wikipédia. L’intérêt de cette recherche est justifié ainsi :
* « history flow provides answers at a glance to questions like, Has a community contributed to the text or has it been mostly written by a single author? How much has a particular contributor influenced the current version of the document? Is the text’s evolution marked by spurts of intense revision activity or does it reflect a smooth transition from its beginning to the present? » (tel que stipulé ici).

En fait, les « History flow » sont des représentations graphiques des données contenues dans les historiques de chacun des articles. Par exemple, à partir de ces graphiques, on peut remarquer que l’article sur IBM a eu une activité principalement composée de l’intégration du matériel proposé par quatre collaborateurs. En revanche, on constate que l’article sur l’Iraq a connu une évolution plus chaotique, avec quelques césures dans les contributions.

En outre, et ceci constitue un point intéressant, le rapport préliminaire de IBM indique, à partir d’une analyse de sujets portant à controverse, que Wikipédia a, dans ces cas, réagit rapidement au vandalisme – à cet effet, il est indiqué que « we’ve also found that vandalism is usually repaired extremely quickly–so quickly that most users will never see its effects. »

S’agissant d’un rapport préliminaire, il est malheureusement difficile d’y dégager des tendances ou des types d’interactions mieux délimités pour le moment. Les analyses de cette étude seront sans doute intéressantes lorsqu’elles seront davantage déployées.

L’article de Robert McHenry

Le 15 novembre 2004, Robert McHenry, qui fut Éditeur en chef de l’Encyclopædia Britannica, a publié un article intitulé The Faith-Based Encyclopedia, où il s’en prend au mode d’édition de Wikipédia, qu’il considère peu fiable. Dans le premier tiers de son article, Robert McHenry fait état d’Interpedia (une idée d’encyclopédie Internet qui a été discutée vers 1993-1994) et de l’accomplissement de Wikipédia (il n’aborde cependant pas Nupedia, le prédécesseur, ou l’incubateur pourrions-nous dire, de Wikipédia). Dans la seconde partie de son article, il dit percevoir le mode d’édition de Wikipédia comme un « quasi-darwinisme » et avance une hypothèse (plutôt personnelle, me semble-t-il) du succès qu’a pu rencontrer ce modèle. Enfin, dans la dernière partie de son article, il critique Wikipédia à partir d’un exemple précis.

Wikipédia n’use pas d’un comité éditorial au sens classique du terme, mais comporte plutôt un processus collectif de relecture, tel que mentionné précédemment. Selon McHenry, il y a dans la confiance en ce processus de relecture quelque chose s’apparentant à un acte de foi (d’où le titre de son article), aussi stipule-t-il que ce processus sous-entend que :
* « Some unspecified quasi-Darwinian process will assure that those writings and editings by contributors of greatest expertise will survive; articles will eventually reach a steady state that corresponds to the highest degree of accuracy. »

Par la suite, McHenry émet une hypothèse, partiellement basée sur l’existence de certaines approches pédagogiques, comme explication possible du « succès » du mode d’édition de Wikipédia. Bien que l’hypothèse que Robert McHenry avance me semble assez discutable, je laisserai ici de côté cette question et m’en tiendrai plutôt à ce qui me semble l’essentiel de sa critique : la notion de « quasi-darwinisme ». Pour étayer son idée selon laquelle la multitude des interventions n’implique pas, de manière nécessaire, une amélioration de la qualité de l’article, il se réfère à l’entrée sur Alexander Hamilton de la version anglophone de Wikipédia. Tel que le mentionne McHenry, l’année de naissance de Alexander Hamilton est incertaine, les spécialistes mentionnant 1755 et 1757 comme possibilités. Ne mentionnant à l’origine qu’une seule des deux dates possibles, la succession des modifications amena certaines incohérences internes à l’article dans la temporalisation des événements. McHenry en vient à la conclusion que la première version de cet article était de meilleure qualité que la version ultérieure qu’il a consultée (en date du 4 novembre 2004), la croyance selon laquelle un article allait nécessairement s’améliorer avec le nombre de modifications étant donc erronée.

Que faut-il en conclure ? Ce que montre ce cas, c’est qu’il n’existe pas un lien nécessaire entre la quantité des modifications/auteurs et la qualité d’un article, rien de plus, rien de moins. À l’inverse de ce cas, il existe des articles dont la qualité s’est améliorée par les modifications successives. C’est par exemple le cas de l’article sur le mont Blanc, dont un examen des diverses versions de son historique (ainsi que les discussions, notamment sur les limites frontalières, de la page dédiée à cet effet) indiquent une amélioration de l’article et l’éclaircissement de certaines ambiguïtés. Il existe aussi une autre possibilité, celle des articles étant de qualité, mais dont la rédaction est majoritairement l’œuvre d’une personne, ou du moins d’un nombre restreint d’auteurs (tel que l’article Langue flexionnelle).

Bien que McHenry tire argument du cas mentionné pour critiquer la fiabilité de Wikipédia, il me semble qu’il en ressort surtout une mise en garde contre la croyance selon laquell
e la quantité des modifications serait un indicateur fiable de la qualité d’un article. Un rappel qui, me semble-t-il, est légitime, tout comme il est légitime de mettre en garde contre des sophismes d’autorité, puisqu’il peut arriver à des spécialistes de commettre eux aussi des erreurs, même de la part de collaborateurs à l’Encyclopædia Britannica. L’important étant ici principalement de ne pas supposer une corrélation entre quantité et qualité, mais plutôt de juger les articles en eux-mêmes, et pour eux-mêmes, en gardant un esprit critique.

Notons que, à la suite de sa critique, on peut cependant souligner l’importance d’une tentative d’anticipation accrue, lors de la rédaction d’articles, des ambiguïtés et des erreurs d’interprétations possibles, afin de les prévenir autant que possible.

L’article de Larry Sanger

Le 31 décembre 2004, Larry Sanger a publié un article intitulé «Why Wikipedia Must Jettison Its Anti-Elitism ». Cet article ne traitant pas de la fiabilité de Wikipédia en tant que telle, mais plutôt de la perception de celle-ci, je ne reprendrai pas ici les points soulevés par cet article. On peut cependant se référer au billet Élite ou mérite ?, où il en a été question.

L’article de John Naughton

Le 9 janvier 2005, John Naughton a publié un article intitulé Why encyclopaedic row speaks volumes about the old guard, qui est en fait un argumentaire faisant suite à la fois à un précédant article qu’il avait écrit en septembre 2004, et à la fois à l’article de Robert McHenry. Naughton mentionne qu’il a le sentiment qu’une partie des réticences face à la fiabilité de Wikipédia provient d’une habitude à penser selon une vision hiérarchique, top-down, des organisations, qui serait trop souvent considérée comme la seule manière de procéder. Le modèle plus « horizontal » de Wikipédia ne signifie cependant pas qu’il soit dépourvu de tout contrôle. À cet égard, il mentionne deux articles de la version anglophone de Wikipédia dont la page d’édition fut bloquée : soit l’article sur George W. Bush, lors de la campagne présidentielle de 2004 – article contenant par ailleurs un bandeau indiquant qu’il y a un désaccord de neutralité –, ainsi qu’un article où « a well-known crackpot wrote a Wikipedia page about himself » (Naughton ne spécifie pas à quel article il fait référence, mais il semble probant qu’il s’agisse de l’article Sollog) ayant engendré une « guerre d’édition » entre l’auteur original et les personnes ayant intervenu pour neutraliser l’article (celui-ci étant maintenant bloqué, afin d’éviter des modifications incessantes ou des vandalismes, dans une version qui est selon Naughton relativement neutre). Aussi, Naughton stipule que ces articles constituent des exemples montrant qu’un contrôle de la qualité n’est pas absent de Wikipédia, bien que le modèle ne soit pas hiérarchique.

John Naughton mentionne par ailleurs dans son article la différence de réactivité du modèle de Wikipédia par rapport au modèle traditionnel, en évoquant le degré d’actualisation de l’article de Wikipédia sur le tsunami (version anglophone à laquelle il fait référence) (article de la version francophone), comparativement à l’article sur le même sujet dans l’Encyclopædia Britannica (l’article de celui-ci n’étant pas actualisé par rapport aux événements de décembre 2004 et contenant plutôt, mentionne-t-il, un vidéo d’un tsunami ayant dévasté Hawaï en 1946).

—-

Aucun de ces articles n’apporte bien entendu de réponse définitive aux questions de fiabilité de Wikipédia, mais elles dressent plutôt un portrait sommaire des échanges qui ont cours à ce sujet…

***
AJOUT du 4 mars 2006 : Lire aussi l’article nuancé de Johann Dréo : Wikipédia, l’encyclopédie asymptotique.

***

AJOUT du 3 juillet 2006 :  VOIR AUSSI:   Roy Rosenzweig, Can History be Open Source?  Wikipedia and the Future of the Past, dans The Journal of American History, volume 93, numéro 1, juin 2006: 117-46

***
AJOUT du 20 mars 2010 : voir aussi l’étude de Jun Liu et Sudha Ram, Who Does What: Collaboration Patterns in the Wikipedia and Their Impact on Data Quality [.pdf, 8 pages), dans 19th Workshop on Information Technologies and Systems, décembre 2009, pages 175-180. Voir aussi le résumé publié sur le site de l’Université d’Arizona, ainsi que sa traduction et adaptation française par Véronique D’Amours sur le site du Réseau d’information pour la réussite éducative.