Le PageRank et la façon dont il est calculé par Google (et les autres moteurs) reste souvent une énigme insondable pour de nombreux référenceurs. Pourtant, plusieurs chercheurs ont tenté de comprendre la façon dont il était établi, en utilisant des méthodes statistiques et probabilistes. Il semblerait notamment qu'il soit possible d'établir une relation d'ordre de grandeur entre le PageRank et le nombre de liens entrants d'une page. Cette piste d'exploration peut notamment nous aider à mieux répartir les liens internes d'un site pour obtenir une meilleure optimisation. Explications...
Cet article fait partie de la Lettre Réacteur #119 du mois d'octobre 2010
Début de l'article :
Les scores de type "PageRank" sont largement utilisés dans les moteurs de recherche, essentiellement parce qu'ils sont de bons indicateurs de la popularité d'une page, mais aussi parce qu'ils sont "relativement" faciles à calculer. Mais il faut bien comprendre ce que signifie ce "relativement"... Historiquement, la formule mathématique qui sert à calculer ce score s'est avérée plus "calculable" que d'autres méthodes, mais elle fait appel à des calculs sur des matrices carrées dont le nombre de lignes et de colonnes se chiffre en ... milliards.
Dans les premières années d'existence du moteur Google, le calcul du PageRank prenait plusieurs jours. Plusieurs astuces ont permis d'accélérer le calcul, comme le recours à l'extrapolation quadratique, et le recours à des PR approchés en calculant un PR pour des nouveaux liens à partir des valeurs existantes et sur une matrice réduite aux liens les plus proches (ex : stratégie du BlockRank, voir articles précédents à ce sujet dans cette lettre). Mais calculer les PageRanks pour tous les noeuds d'un graphe de liens aussi vaste que le World Wide Web reste un défi mathématique et informatique.
Les propriétés mathématiques du PageRank ont été (et sont toujours) largement étudiées. Au cours de ces recherches, plusieurs équipes scientfiques ont été intriguées par un résultat statistique : les valeurs des PR des pages et le nombre de liens entrants sont distribués d'une manière très proche. Nous allons voir dans cet article ce que signifie ce résultat et pourquoi il est surprenant. Et nous allons en tirer un indicateur très opérationnel pour le SEO, notamment pour le PageRank Modeling.
Le nombre de liens entrants : un médiocre indicateur de la popularité d'un site ?
Si l'on souhaite calculer un score de popularité pour une page web, il vient tout de suite à l'idée de prendre pour indicateur le nombre de liens entrants : plus une page reçoit de liens, plus elle est populaire.
...
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).