MSN a lancé depuis début février sa technologie "moteur" et se positionne comme l'un des trois "grands" du domaine. Il devient donc important d'optimiser ses pages web en fonction des critères de pertinence de son algorithme de recherche. Dans un premier article, le mois dernier, nous avions effectué la synthèse des informations que l'on trouvait à ce sujet sur le site officiel de MSN, dans les articles disponibles sur le Web et dans les forums anglophones et francophones. Ce mois-ci, nous vous proposons les résultats d'une batterie de tests que nous avons effectués sur ce moteur.

Ce mois-ci, nous avons donc lancé une batterie de tests sur le moteur de recherche MSN Search France (http://search.msn.fr/) afin de mieux comprendre sa logique de "ranking" des pages web.  Pour ce faire, nous avons conçu un programme permettant de récupérer et d’analyser les 10 premiers liens de 100 requêtes (mille mercis à la société Brioude Internet - http://www.referencement-2000.com/ pour son aide à la réalisation de cet outil) effectuées sur le moteur. En prenant en compte le fait que celui-ci ne retourne pas toujours 10 liens par pages de résultats, le système mis en place nous a fourni 905 liens à analyser. Le titre, le texte, les balises meta, tout a été scruté pour tenter d'en savoir plus sur ce moteur.

Petite réserve à signaler : le travail a été effectué en analysant la version "réelle" des pages disponibles en ligne, et non pas la version en cache. Donc, si le document a changé entre le moment où il a été indexé par le moteur et le moment où les tests ont été effectués, cela peut légérement modifier les calculs...

Sans plus tarder, voici les résultats de cette analyse...

Titre des pages > nombre d'occurrences du mot

Nombre de titres ne contenant pas le mot demandé : 557 (62%)

Nombre de titres ne contenant qu'une occurrence du mot : 319 (35%)

Nombre de titres contenant deux fois le mot demandé : 29 (3%)

Aucun titre ne contient plus de deux fois la requête.

Conclusion : La présence du mot dans le titre des pages n'est pas une condition indispensable puisque près des deux-tiers des résultats analysés ne le contiennent pas. En revanche, le fait qu'il soit présent ne semble pas pénalisant à partir du moment où il ne dépasse pas la limite de deux occurrences. Evitez donc à tout prix des titres contenant trois occurrences (ou plus) d'un même terme.

Titre des pages > nombre de mots

Nombre de pages n'ayant pas de titre : 37 (4%)

Nombre de pages ayant un titre sur un seul mot : 27 (3%)

Nombre de pages ayant un titre sur 2 mots : 38 (4,2%)

Nombre de pages ayant un titre sur 3 mots : 109 (12%)

Nombre de pages ayant un titre sur 4 mots : 60  (6,6%)

Nombre de pages ayant un titre sur 5 mots : 69  (7,6%)

Nombre de pages ayant un titre sur 6 mots : 57 (6,3%)

Nombre de pages ayant un titre sur 7 mots : 62 (6,8%)

Nombre de pages ayant un titre sur 8 mots : 66 (7,3%)

Nombre de pages ayant un titre sur 9 mots : 57 (6,3%)

Nombre de pages ayant un titre sur 10 mots : 72 (8%)

Nombre de pages ayant un titre sur 11 mots : 67 (7,4%)

Nombre de pages ayant un titre sur 12 mots : 60 (6,6%)

Nombre de pages ayant un titre sur 13 mots : 31 (3,4%)

Nombre de pages ayant un titre sur 14 mots : 38 (4,19%)

Nombre de pages ayant un titre sur 15 mots : 19 (2,1%)

Nombre de pages ayant un titre sur 16 mots : 21 (2,3%)

Nombre de pages ayant un titre sur 17 mots : 12 (1,3%)

Nombre de pages ayant un titre sur 18 mots : 12 (1,3%)

Nombre de pages ayant un titre sur 19 mots : 6 (0,66%)

Nombre de pages ayant un titre sur 20 mots : 11 (1,2%)

Nombre de pages ayant un titre sur plus de 20 mots : 16 (1,8%)

Taille moyenne d'un titre : 8,52 mots

Conclusion : Le spectre du nombre de mots des titres est assez large, de 3 à 12 termes. Le pic se trouve à 3 mots mais l'étendue de la longueur des titres analysés indique une valeur moyenne de 8 mots. En revanche, il semble important de ne pas franchir la barre des 12 termes, car l'intérêt semble diminuer fortement ensuite.

Titre des pages > nombre de caractères

Nombre de titres à 0 caractères : 37 (4%)

Nombre de titres de 1 à 10 caractères : 35 (3,9%)

Nombre de titres de 11 à 20 caractères : 56 (6,2%)

Nombre de titres de 21 à 30 caractères : 102 (11,3%)

Nombre de titres de 31 à 40 caractères : 87 (9,6%)

Nombre de titres de 41 à 50 caractères : 88 (9,7%)

Nombre de titres de 51 à 60 caractères : 103 (11,4%)

Nombre de titres de 61 à 70 caractères : 71 (7,8%)

Nombre de titres de 71 à 80 caractères : 103 (11,4%)

Nombre de titres de 81 à 90 caractères : 71 (7,8%)

Nombre de titres de 91 à 100 caractères : 50 (5,52%)

Nombre de titres de 101 à 110 caractères : 33 (3,6%)

Nombre de titres de 111 à 120 caractères : 22 (2,4%)

Nombre de titres de 121 à 130 caractères : 14 (1,5%)

Nombre de titres de 131 à 140 caractères : 2 (0,2%)

Nombre de titres de 141 à 150 caractères : 16 (1,8%)

Nombre de titres de plus de 150 caractères : 16 (1,8%)

Taille moyenne d'un titre : 59,82 caractères


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).