Le palmarès des outils de recherche 2001 (http://palmares.abondance.com/) l'a révélé : Kartoo (http://www.kartoo.com/), le métamoteur à interface cartographique, sera certainement l'un des grands acteurs de l'année 2002, puisqu'il a été élu "meilleur espoir 2002", "meilleur métamoteur web" et a terminé deuxième (derrière Google, excusez du peu) dans la catégorie "outil de recherche le plus innovant".
Une bonne occasion pour se pencher sur le berceau de cet outil, né en avril 2001 (voir http://actu.abondance.com/actu0117.html#mercredi), afin d'essayer de mieux comprendre comment il fonctionne (merci à Laurent Baleydier, son concepteur, pour avoir fourni puis vérifié toutes les infos ci-dessous) :
Analyse de la requête
~~~~~~~~~~~~~~~~
Sur KartOO, on distingue deux modes :
- Le mode automatique (http://www.kartoo.com/) dans lequel le programme choisit de lui-même les moteurs à interroger en fonction du type de requête saisie par l'internaute.
- Le mode manuel (lien "moteurs" sur la page d'accueil) dans lequel l'utilisateur sélectionne lui-même les sources, donc les outils de recherche à interroger en simultané.
En mode automatique, la requête est traitée en plusieurs étapes :
KartOO transforme les "+" en espaces, supprime les "\" et les parenthèses, ainsi que tout caractère qu'il considère comme "parasite". Bref, il "nettoie" la requête. Le programme vérifie ensuite s'il y a un "?" à la fin de la requête. Si c'est le cas, il interroge les moteurs les plus doués pour le langage naturel (MSN et NorthernLight d'après les tests de Kartoo). Dans le cas de questions posées en langage naturel, on pourrait s'attendre à ce que le métamoteur interroge des outils qui sont réellement conçus pour cela, comme Ask Jeeves ou Infoclic. Mais ça n'a pas été mis en place parce que la présentation des résultats sur ces outils ne se prête pas bien à la cartographie : il est juste affiché une question de quelques mots, souvent pas d'URL en clair ni de description de la page, ce qui ne correspond pas vraiment à la "charte de fonctionnement" de Kartoo.
S'il n'y a pas de "?" à la fin de la question, la requête est découpée en fonction des espaces et de la syntaxe utilisée : des "-", des guillemets, des "OR", "NEAR", "url:", "site:", et autres opérateurs avancés (la syntaxe finale ressemble alors à celle d'Altavista).
KartOO corrige ensuite la requête pour qu'elle reste cohérente (par exemple, quand 2 opérateurs se suivent, il ne garde que le dernier : "NEAR OR" devient alors "OR"). En fonction des opérateurs rencontrés et de la langue choisie, le programme sélectionne les moteurs les plus pertinents. Par exemple, en francais, pour une requête simple (saisie sur un ou deux mots sans opérateur spécifique), il interroge actuellement Google, Voila, AlltheWeb et Yahoo! en simultané. Cette sélection automatique peut cependant changer parfois en fonction de la disponibilité des moteurs et des tests de pertinence effectués par l'outil dans le cadre de sa veille continuelle. Kartoo utilise alors une "table de correspondance" qui associe le type de requête demandée avec les outils de recherche qui lui semblent les plus pertinents à chaque fois. Notons que cette fonctionnalité "transparente" qui fait en sorte que les outils interrogés sont différents en fonction de la requête demandée est assez unique dans le monde des métamoteurs et est très innovante.
En mode manuel, la requête n'est, cette fois, pas modifiée avant d'être envoyée aux moteurs de recherche.
La requete est, dans ce cas, "simplement" traduite dans la syntaxe de chaque moteur grace, là aussi, à des "tables de correspondance". Si un moteur ne supporte pas la syntaxe, il n'est pas interrogé lorsqu'on est en mode automatique. En mode manuel, KartOO renvoie également un avertissement.
Si les mots demandés sont très communs, très courants, le résultat est instantanément renvoyé par le "cache" (la mémoire tampon) du métamoteur et les moteurs eux-mêmes ne sont pas interrogés une nouvelle fois. Ce système de tampon est mis à jour toutes les 24h, pour rester d'actualité.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).