Infoclic a été conçu et imaginé par deux amis, Frédéric Plais et Renaud Lacroix, en 1999. Ce dernier s'occupait jusqu'alors de veille Internet chez Peugeot. Les deux fondateurs sont issus de Sup de Co Paris. La genèse de l'outil est basée sur une réflexion autour de la recherche d'information et des besoins des internautes dans ce domaine. Dans un premier temps, les deux compères avaient imaginé travailler autour des forums de discussion. Puis, ils découvrent le site Ask Jeeves (http://www.ask.com/) et se disent qu'il s'agit de façon évidente d'une voie d'avenir. Aussitôt dit, aussitôt fait (ou presque ;-)). En décembre 99, la société est créée et le site est mis en ligne en janvier 2001. Aujourd'hui, 9 personnes travaillent à la mise en place et à la maintenance de l'outil. En mai 2001, le site accueillait 15 000 visiteurs uniques pour un total d'envrion 200 000 pages vues. Ce même mois, 35 000 questions ont été posées sur le site, avec une vague d'interrogations sans précédents sur... devinez quoi ? Eh oui, vous avez gagné : Loft Story (voir plus loin dans cette lettre) !
Une étude, menée il y a quelques mois et portant sur les outils de recherche Internet, indiquait que l'interrogation en langage naturel (le fait de poser ses questions sous la forme de phrases intelligibles comme "Quel temps fait-il à Paris aujourd'hui ?") avait grimpé, en quelques mois, de 0% à 11% chez les internautes. Pourquoi une augmentation si brutale ? Grâce à l'avènement d'un outil intéressant qui s'appuie sur ce type de technologies : Ask Jeeves, la "muse" d'Infoclic.
Pendant longtemps, on s'est désespéré de voir arriver dans l'Hexagone un équivalent à cet outil. Infoclic a donc comblé ce manque. Basé sur un concept très proche de celui d'Ask Jeeves, il permet de saisir une question en langage naturel. Puis, sur la page de résultats, plusieurs questions nouvelles, basées sur celle posée auparavant, sont proposées. Pour chacune de ces questions affinées, une seule réponse (un seul site) est affichée en cliquant sur un bouton adéquat.
Le but d'Infoclic est de répertorier une liste - la plus grande possible - de questions, puis d'y apporter une réponse et une seule de façon automatique. Objectif : lorsque l'internaute pose sa question, l'outil tente de la rapprocher d'une interrogation existante qui a déjà trouvé une réponse. C'est cette liste de questions "connexes" qui est proposée.
La base de données de questions et de réponses uniques commence à être conséquente pour un site si récent (il en répertorie 430 000 à l'heure actuelle avec un objectif d'un million à moyen terme). Bien entendu, elle n'est pas encore parfaite et vous risquez d'être parfois déçu car vous n'aurez pas trouvé chaussure à votre pied. Mais dites-vous que les responsables des la base de données d'Infoclic auront identifié votre question, posée en ligne, et auront vérifié qu'elle n'a pas réellement donné lieu à une réponse pertinente. Il y a de fortes chances pour qu'ils s'attellent alors à la tâche pour le prochain internaute ayant la même interrogation...
Il est également possible de consulter les réponses de Voila, Google et Altavista ou de demander conseil à un expert par le biais d'un partenariat avec le site Woonoz. Il s'agit là de simples partenariats, mais des discussions sont en cours avec certains annuaires francophones pour intégrer directement leurs résultats dans les pages de réponses d'Infoclic. Objectif : fournir une info avec le moins de clics possibles de la part de l'internaute.
Structure de l'outil ------------------------
L'outil Infoclic est basé sur deux "briques" essentielles : lorsque l'internaute pose sa question en langage naturel, celle-ci est prise en charge par l'outil "Efficient Info". Il s'agit d'une application développée en utilisant les technologies Com+ de Microsoft. Celui-ci a la charge d'extraire de la question les mots importants et significatifs permettant de résoudre la question posée. Une fois ces termes extraits de la question, ils sont fournis à la deuxième "brique", le logiciel "Intuition" de la société Sinequa (http://www.sinequa.com/). Intuition va alors interroger une base de données de format propriétaire des 430 000 questions/réponses pour identifier celles qui sont le plus proches de la demande de l'Internaute.
L'outil "Efficient Info" a pour objectif de mieux comprendre la question de l'internaute. Il utilise pour cela :
- Une base de synonymes.
- Une base d'expressions (par exemple des titres de films, de livres, de CD qui seront alors fournis intégralement à Intuition).
- Un système de création de formulaire pré-établis (cartes géographqiues, calculs d'itinéraires, formulaires SNCF, codes postaux, etc. Le système comporte plus de 15 possibilités différentes).
- Un système d'épuration de mots morts, vides de sens ("je voudrais acheter", "quel est le prix de", "je recherche une information sur", etc.) ou d'"expressions types" (pas obligatoirement vides de sens) pour lesquelles il est indiqué au moteur qu'elles sont synonymes d'autres expressions déja référencées.
L'outil permet également depuis peu un "plus" en termes d'interactivité (il répond "bonjour", "bonsoir", etc.) et renvoie directement au site demandé si la question posée se présente sous la forme d'une url (www.abondance.com), comme cela arrive parfois.
Une fois la question épurée et traduite sous une forme adéquate, elle est fournie au logiciel Intuition de Sinequa qui est chargé de trouver sa correspondance dans la base de donnée Infoclic des couples questions/réponses qui comprend 15 champs de recherche distincts.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).