Le site américain Altavista.com a fait peau neuve il y a peu. Notons que, le mois prochain, la lettre "Réacteur" ici présente, consacrera un dossier à la nouvelle mouture d'Altavista France, elle aussi totalement rénovée depuis quelques jours. Altavista.com a profité de cette nouvelle version pour apporter quelques modifications à son outil de recherche.
Recherche d'information --------------------------------------------------------------------------------
Tout d'abord, l'index d'Altavista est passé de 350 à 550 millions de pages web. Bien entendu, comme vous l'avez certainement constaté, le portail est devenu outil de recherche, se recentrant autour de son activité originelle : la recherche d'information. Ceci dit, cela ne semble pas remettre en cause l'existence du site Raging Search (http://www.ragingsearch.com/), qui avait également cette même approche à son lancement.
Un outil de recherche spécifique sur le commerce électronique (http://shopping.altavista.com/) a également été lancé sous une nouvelle forme, car, selon Altavista, 20 à 25% des requêtes ont trait à ce domaine sur le Web, notamment américain. D'autres outils de recherche verticaux, comme sur l'actualité (http://news.altavista.com/) sont également disponibles.
Expressions, ET et OU --------------------------------------------------------------------------------
Sur l'outil de recherche, Altavista a mis en place un nouvel algorithme de recherche. Pour les expressions saisies comprenant 2 à 4 mots clés, il effectue, au départ, une recherche dans un dictionnaire qui lui est propre et qui contient quelques 500 000 expressions constituées de plusieurs termes. Si l'expression demandée est identifiée dans ce dictionnaire, c'est celle-ci qui sera recherchée, comme si l'internaute avait utilisé les guillemets. Les pages les contenant "telles quelles" seront donc affichées en premier dans les résultats. Puis, à la suite, les documents contenant obligatoirement tous les mots demandés (opérateur ET entre les différents mots) sont affichés. C'est donc maintenant un ET qui est appliqué par défaut, à la place du OU, comme avant. Pour les expressions de 5 mots et plus, la détection de phrases dans le dictionnaire est encore active, mais c'est, ici, un OU qui sera appliqué entre les termes une fois les occurrences de type "expressions" affichées. Mais il est vrai que peu de gens tapent plus de 4 termes dans le formulaire.
Pour résumer : --------------------------------------------------------------------------------
- Mot clé unique : l'algorithme "classique" est pris en compte.
- Expressions de 2 à 4 mots : recherche en premier de l'expression exacte (équivalent aux guillemets) si elle est trouvée dans le dictionnaire d'Altavista. Recherche avec un ET entre les mots après affichage des pages contenant l'expression identifiée dans le dictionnaire. Si l'expression demandée n'est pas trouvée dans le dictionnaire, un opérateur ET est appliqué entre les différents termes dès le départ.
- Expressions de 5 mots et plus : processus identique au précédent, mais avec un OU entre les différents mots clés à la place du ET.
Bien entendu, les autres critères de classement (notamment l'indice de popularité) d'Altavista doivent également être pris en compte dans cette réflexion. Tout n'est pas si simple chez les outils de recherche... 😉 Enfin, la fonction "Search Within Results" a également vu le jour dans les pages de résultats du moteur. Elle permet, comme sur de nombreux autres outils de recherche, d'affiner une recherche sur les pages identifiées sur une première requête.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).