La technologie YST de Yahoo! équipe aujourd'hui de nombreux moteurs de recherche. Mais tous affichent-ils la même information pour un même mot clé ? Cet article tente de faire ressortir les différences entre les différentes façons d'afficher les "résultats YST" par AltaVista, AllTheWeb, MSN et les autres. Et elles sont nombreuses ! 

Vous le savez certainement, les technologies des moteurs de recherche AltaVista et AllTheWeb ont aujourd'hui vécu et ont été remplacées, sur ces deux sites, par la technologie YST de Yahoo!, qui équipe également les sites de Yahoo! depuis plusieurs semaines. Il en est de même des clients "search" d'Inktomi, comme Lycos, MSN et HotBot. Tous ces portails proposent donc, aujourd'hui, des résultats de recherche issus de la technologie YST. Mais tous ces portails, pour un même mot clé, affichent-ils exactement le même résultat ? C'est ce que nous avons cherché à savoir en comparant les pages de résultats de ces différents outils...

Moteurs de recherche anglophones

Dans un premier temps, nous avons comparé les résultats des principaux outils utilisant YST dans leur version anglophone : Yahoo! (http://search.yahoo.com/), bien sûr, mais également AltaVista (http://www.altavista.com/), AllTheWeb (http://www.alltheweb.com/), MSN (http://search.msn.com/) et HotBot (http://www.hotbot.com/).

On peut noter que le site américain de Lycos, qui affichait il y a un temps les liens issus de la technologie AllTheWeb, propose maintenant les résultats de Looksmart et de son moteur Wisenut. Nous ne l'avons donc pas inclus dans ce comparatif. Sur HotBot.com, les résultats YST s'obtiennent au travers de l'option "résultats fournis par HotBot" sur la page d'accueil.

Premier comparatif : tous ces outils de recherche affichent-ils de la même façon les résultats proposés ? Réponse :

Affichage des résultats :

Titre Si le site est dans l'annuaire : titre issu de l'annuaire

Si le site est absent de l'annuaire : titre de la page (120 caractères max environ)

Titre de la page (120 caractères max environ) Titre de la page (120 caractères max environ) Si le site est dans l'annuaire de Looksmart : titre issu de l'annuaire

Si le site est absent de l'annuaire : titre de la page (120 caractères max environ)

Titre de la page (70 caractères max environ)
Descriptif Si le site est dans l'annuaire : descriptif issu de l'annuaire

Si le site est absent de l'annuaire : contenu de la balise "meta descrption" (si disponible - 200 caractères max environ) ET "snippet" (extrait de la page contenant le mot demandé - 300 caractères max environ)

Contenu de la balise "meta descrption" (si disponible - 200 caractères max environ) ET "snippet" (extrait de la page contenant le mot demandé - 300 caractères max environ) Contenu de la balise "meta descrption" (si disponible - 200 caractères max environ) ET "snippet" (extrait de la page contenant le mot demandé - 300 caractères max environ) Si le site est dans l'annuaire de Looksmart : descriptif issu de l'annuaire

Si le site est absent de l'annuaire : contenu de la balise "meta descrption" (si disponible - 200 caractères max environ) ET "snippet" (extrait de la page contenant le mot demandé - 300 caractères max environ)

Contenu de la balise "meta descrption" (si disponible - 200 caractères max environ) ET "snippet" (extrait de la page contenant le mot demandé - 200 caractères max environ)
URL URL de la page (100 caractères max) URL de la page (86 caractères max) URL de la page (86 caractères max) URL de la page (70 caractères max) URL de la page (75 caractères max)
Taille de la page OUI NON OUI NON OUI
Date de dernière mise à jour de la page NON NON NON NON OUI
Traduction OUI OUI NON NON NON
Version en cache OUI NON NON NON NON
Accès aux autres pages du site (clustering) OUI

("more pages from this site")

OUI

("more pages from... ")

OUI

("more hits from... ")

NON NON
Catégorie de l'annuaire OUI

(si le site est présent dans l'annuaire)

NON NON NON NON
Code bourse OUI , à droite du titre (NYSE, Nasdaq si la société est cotée) OUI, en début de page NON NON NON
Possibilité d'ouvrir le lien dans une fenêtre différente OUI NON NON NON NON
Nombre de résultats par page (par défaut) 20 10 10 15 10
"Related searches" OUI

(4 plus lien "more...")

OUI

(10 max)

OUI

(7 plus lien "more...")

NON NON

 

Conclusion : s'ils utilisent tous l'index d'YST, les outils de recherche ne traitent pas de la même façon les résultats proposés :

- Titre : il peut être issu de la page web directement ou d'un annuaire comme ceux de Yahoo! ou de Looksmart.

- Descriptif : de la même façon, il peut être extrait de la page ou d'un annuaire. Il peut être plus ou long, donc plus ou moins précis et descriptif.

- URL : elle peut également être plus ou moins longue, donc plus ou moins explicite.

- Taille de la page : seuls Yahoo!, AllTheWeb et HotBot l'affichent.

- Date de dernière mise à jour de la page : seul HotBot propose cette information !

- Traduction de la page : seuls Yahoo! et AltaVista proposent cette option.

- Version en cache : uniquement disponible sur Yahoo!.

Etc.

Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).