Résumé de l'article :

Google s'est fait connaître sur le Web au travers de son célèbre PageRank, indice de popularité calculé sur la base d'une analyse quantitative et qualitative des liens pointant vers une page web. Mais, depuis quelques années, on parle de plus en plus d'un autre indice, baptisé TrustRank, et qui servirait à Google pour mesurer la confiance que l'on peut avoir dans un site web donné, sur la base de critères humains et automatiques. Qu'en est-il exactement de ce fameux TrustRank, dont le nom vient en fait d'ingénieurs de chez Yahoo! ? Info ou intox ? Enquête pour en savoir plus...

Début de l'article :

En ce début d'année, nous allons revenir sur un des mystères récurrents du web, avec cet article consacré au TrustRank. Est-ce que ce système est toujours utilisé par Google ? Quelles en seront les évolutions probables en 2009 ? Commençons notre exploration...

Définition du TrustRank

On a commencé à entendre parler de ce nouveau critère de classement au travers d'un article rédigé en mars 2004 par deux chercheurs de l'université de Standford et intitulé "Combatting web spam with TrustRank" (http://www.vldb.org/conf/2004/RS15P3.PDF). Les chercheurs (qui travaillaient pour Yahoo) proposaient de créer une liste de sites de confiance (trusted sites) et d'accorder une attention particulière aux liens du web provenant de ces sites, partant de l'hypothèse qu'un lien issu d'un site de confiance pointe généralement vers un autre site de confiance.

Le TrustRank, au cœur de ce nouveau système, désigne ainsi l'indice de confiance accordé à un site web, et ce signal se propage d'un site à l'autre de façon décroissante. Plus on est "loin" du site de confiance initial (au sens du nombre de liens donc du nombre de clics nécessaire pour y arriver), plus le TrustRank diminue.

Pour la petite histoire, Google a déposé en 2005 le nom de marque TrustRank mais il n'y aurait pas de rapport direct avec le projet développé par les chercheurs de Yahoo. Dans une vidéo publiée sur Youtube en novembre 2007, on voit notamment Matt Cutts expliquer que le TrustRank de Google n'a rien à voir avec celui décrit dans l'article de Standford


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).